달력

11

« 2017/11 »

  •  
  •  
  •  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  •  
  •  

'전체'에 해당되는 글 138

  1. 2008.01.08 mysql 간단한 명령어들.
  2. 2008.01.07 day 4
  3. 2008.01.07 C++ STL의 교과서
  4. 2008.01.06 svn 사용하기
  5. 2008.01.06 network설정법.
  6. 2008.01.05 day 2 & 3
  7. 2008.01.03 day1
  8. 2008.01.02 이곳을 만들게 된 계기는 netflix
2008.01.08 00:47

mysql 간단한 명령어들. 삽질예방/mysql2008.01.08 00:47

http://kwon37xi.egloos.com/1634694

mysql -uroot -p
 - root계정으로, 비밀번호를 입력하여 접근

show databases;
 - 현재 가진 데이터베이스들을 열어본다.

desc db;
 - db의 내용을 보는 듯?

select * from user;
 - 사용자들 목록을 볼 수 있다.

create database <db_name>;
 - db_name이라는 데이터베이스 생성


** 참고사항
 mysql에서 tab을 누르면 자동완성기능이 있으니 생각 안나면 참고해보자.
간단한 사용자추가는 그냥 mysql-admin을 이용(GUI)

신고
Posted by Kwang-sung Jun
2008.01.07 06:27

day 4 netflix prize/일지2008.01.07 06:27

netflix prize research day 4
 - grouper.cpp와 filler.cpp로 나누었다.
 - grouper.cpp는 그룹화 시켜서 하위 폴더, grouped_file 폴더에 저장된다.
 - 각 파일은 group0001.txt와 같은 모양을 하고 있다.
 - filler.cpp는 그룹화된 파일들을 바탕으로 하여 직접 문제에 답을 작성해 나가게 될 프로그램이다.
 - svn을 도입하여 프로젝트형상관리(?ㅎㅎ)를 시작하였씁니다.
 - 오늘의 삼질은. STL에 대한 것이다. STL에서 find()함수는 iterator를 리턴한다. 그리고 찾지 못한 경우는 <stl객체>.end()와 같은 값을 같게 된다. 또한. map의 경우 []가 오버로딩되어있는데  tmpMap[2];라는 문장이 수행만 되어도 키값 2, 밸류 0으로 삼는 멤버가 생성되는 조금 특이한 경우가 있다. 이거때문에 세네시간은 삽질하지 않았나 싶다.

TODO
  - 통계프로그램을 구했으니 슬슬 자료 분석도 시작해 봐야지
 - 2007년 1등한사람의 PDF를 종종 읽으며 연관기술을 습득하자.
 - STL사용법을 삽질기에 적어놓도록 하자.
  1. 주먹구구식이라도 알고리즘 적용하여 한번 풀어보기
  2. 베이지안 네트워크 적용하여 풀기. (통계프로그램의 분석을 통한 확률을 알고 있어야 한다.)

 - 가장 시급한 것은 알고리즘을 개선하는 것이다. 현재 한시간동안 영화를 대략 500개정도 군집화(그룹화)가능하다.
collaborative filtering에 대한 wikipedia자료 정리하기.

문제해결법에 대한 IDEA
1. 그때 그때 qualifying에서 나오는 자료를 보고 즉석 계산한다.
 -> 중복계산이 너무나 많다.
 
2. user들을 군집화시킨 후 알고리즘을 적용한다.(합리적...)
 
3. 영화제목으로부터 연관관계를 끌어낼 수 있을까(시리즈물, 어두운 분위기, 공포 등)
 - WWE
 - soldier
 - Dark
 - dragon ball
 - national geographic
 - 영화제목에 위의 단어가 들어있다면. 이용자가 시리즈물을 보고 평가한 결고를 반영할 수 있다.
 - (user base + item base)
 - 자주 검색되는 단어를 이용해도 된다.
 
4. 시간적으로 '최근' 취향이 비슷할 수록 가중치가 높아진다.
 - user간에 얼마나 '많은' 영화의 평점이 얼마나 '많이'같은지, 그 각각의 영화가 얼마나 시기적으로 '가까운'지에
대하여 유사도를 계산한다..
신고
Posted by Kwang-sung Jun
2008.01.07 04:57

C++ STL의 교과서 삽질예방/STL 교과서2008.01.07 04:57

http://ws1.kist.re.kr/doc/pgC++_lib/stdlibug/booktoc1.htm

링크 그대로 따올 기술없는 나를 용서하자.


신고
Posted by Kwang-sung Jun
2008.01.06 23:49

svn 사용하기 삽질예방/svn 사용하기2008.01.06 23:49

http://www.pyrasis.com/main/Subversion-HOWTO#s-4.3
SVN은 이거 보면 거의 될겁니다. ㅋ
신고
Posted by Kwang-sung Jun
2008.01.06 23:39

network설정법. 삽질예방/Linux2008.01.06 23:39

ifdown eth0
 - eth0 를 내 "사용안함"
ifup eth0
 - eth0 를 사용함

sudo vim /etc/network/interfaces
 - inet static 을 inet dhcp로 하면 자동할당
 - alter:: 시스템 - 관리도구에 들어가면 그냥 선택할 수 있다.

sudo vim /etc/resolv.conf
 - dns서버의 설정
 
참고

민섭이형네(open.ssu.ac.kr/~ssangbuja/tt )서 퍼온,
WLAN_SoongSil 우분투에서 잡기

http://open.ssu.ac.kr/~ssangbuja/tt/entry/WLANSoongSil-%EC%9A%B0%EB%B6%84%ED%88%AC%EC%97%90%EC%84%9C-%EC%9E%A1%EA%B8%B0
신고
Posted by Kwang-sung Jun
2008.01.05 02:05

day 2 & 3 netflix prize/일지2008.01.05 02:05

netflix prize research day 2&3
-  노트북에 리눅스를 설치하고 코딩을 시작하였다.
- C++ 최적화 옵션 -static -O3를 사용하였다.
- 알고리즘 :
  1. 각 유저들의 rating을 기반으로 그룹화를 한다.
  2. 그룹을 바탕으로하여 실제 rating을 추측해낸다.
- 문제점 : 시간이 너무 오래걸린다. OTL
- 방향개선 : 통계자료 이용, db이용
TODO
  1. 주먹구구식이라도 알고리즘 적용하여 한번 풀어보기
  2. 베이지안 네트워크 적용하여 풀기. (통계프로그램의 분석을 통한 확률을 알고 있어야 한다.)

 - 가장 시급한 것은 알고리즘을 개선하는 것이다. 현재 한시간동안 영화를 대략 500개정도 군집화(그룹화)가능하다.
collaborative filtering에 대한 wikipedia자료 정리하기.

문제해결법에 대한 IDEA
1. 그때 그때 qualifying에서 나오는 자료를 보고 즉석 계산한다.
 -> 중복계산이 너무나 많다.
 
2. user들을 군집화시킨 후 알고리즘을 적용한다.(합리적...)
 
3. 영화제목으로부터 연관관계를 끌어낼 수 있을까(시리즈물, 어두운 분위기, 공포 등)
 - WWE
 - soldier
 - Dark
 - dragon ball
 - national geographic
 - 영화제목에 위의 단어가 들어있다면. 이용자가 시리즈물을 보고 평가한 결고를 반영할 수 있다.
 - (user base + item base)
 - 자주 검색되는 단어를 이용해도 된다.
 
4. 시간적으로 '최근' 취향이 비슷할 수록 가중치가 높아진다.
 - user간에 얼마나 '많은' 영화의 평점이 얼마나 '많이'같은지, 그 각각의 영화가 얼마나 시기적으로 '가까운'지에
대하여 유사도를 계산한다..
신고
Posted by Kwang-sung Jun
2008.01.03 06:08

day1 netflix prize/일지2008.01.03 06:08

netflix prize research day 1
-  netflix를 다운로드하고 자료의 생김새와 출력 형태를 정리하였다.
 
- 하루에 조금씩이라도 코딩을 하며 흥미를 잃지 않도록 격려한다.
 
- STL C++ 링크드리스트 또는 vector를 이용하여 작성해보자.

TODO
  1. 주먹구구식이라도 알고리즘 적용하여 한번 풀어보기
  2. 베이지안 네트워크 적용하여 풀기.
 
collaborative filtering에 대한 wikipedia자료 정리하기.

문제해결법에 대한 IDEA
1. 그때 그때 qualifying에서 나오는 자료를 보고 즉석 계산한다.
 -> 중복계산이 너무나 많다.
 
2. user들을 군집화시킨 후 알고리즘을 적용한다.(합리적...)
 
3. 영화제목으로부터 연관관계를 끌어낼 수 있을까(시리즈물, 어두운 분위기, 공포 등)
 - WWE
 - soldier
 - Dark
 - dragon ball
 - national geographic
 - 영화제목에 위의 단어가 들어있다면. 이용자가 시리즈물을 보고 평가한 결고를 반영할 수 있다.
 - (user base + item base)
 - 자주 검색되는 단어를 이용해도 된다.
 
4. 시간적으로 '최근' 취향이 비슷할 수록 가중치가 높아진다.
 - user간에 얼마나 '많은' 영화의 평점이 얼마나 '많이'같은지, 그 각각의 영화가 얼마나 시기적으로 '가까운'지에
대하여 유사도를 계산한다..
신고
Posted by Kwang-sung Jun
2008.01.02 08:57

이곳을 만들게 된 계기는 netflix 분류없음2008.01.02 08:57

netflix prize때문에 만들었습니다.
혹시 관심있는 사람들이 검색하다가 한번씩 들리지 않을까 싶기도 하고
아니 그보다도 제가 공부한 내용 적어놓으려고 말입니다. ㅎㅎ
신고
Posted by Kwang-sung Jun