달력

5

« 2024/5 »

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
2008. 2. 13. 14:52

개발속도 단축 netflix prize/기타2008. 2. 13. 14:52

주어진 셋을 축소시켜서

프로그램을 짠다.(왜냐면, 기본 데이터는 너무나도 양이 커서, 테스트에 지나치게 많은 시간이 소모되기 때문이다.)

예를 들면 한 영화에 대한 사용자 레이팅은 100건 까지만 인식한다든가...
(그렇게 하면 rating한 유저의 명수는 줄어들겠지만..)

알고리즘의 성능은 떨어지겠지만, 개발 과정에서는 크게 상관없으므로...!

:
Posted by Kwang-sung Jun
2008. 2. 13. 14:32

논문 아이디어 netflix prize/기타2008. 2. 13. 14:32

k-NN
factorization
RBM(Restricted BoltzMann Machines)
asymmetric factor models

네 가지의 blending(ensemble)을 이용한 실용적인 추천시스템 고안
네 가지의 주요 알고리즘의 성능 분석(비교대조)

:
Posted by Kwang-sung Jun
2008. 2. 13. 11:36

황규백 교수님 면담 (1) netflix prize/논문 미팅2008. 2. 13. 11:36

1. Ax = b 원래의 복잡한 연산을 매트릭스로 압축시켜놓은 것일 뿐.

2. 공부내용 정리 및 문서화는 어떻게? -> 답없음

3. machine learning 교재 추천. MACHINE LEARNING, McGraw Hill, TOM. M. MITCHELL

4. 교수님께서 논문쓰실때 구현은 - 언제나 C, 행렬처리는 MATLAB을 쓰는것이 더 빠르다.
JAVA 기계학습 라이브러리 - WEKA
S, S+
R (통계 패키지)

5. 논문 -> 정보과학회에 낼 수 있을 것 같다.(2007년에는 4월 17일경에 제출 마감이 있었다.)
학회는 international학회라해서 항상 규모가 있는 것은 아니다. 일단 국내 학회에 낸 후, 국외에 내도 늦지 않다.

다음은 <포스터 발표>

사용자 삽입 이미지

다음은 <구두 발표>
사용자 삽입 이미지

구두 발표


6. 논문 검색 -> 그냥 구글을 이용하는 것이 편하다.
* review article ->새로운 것을 제안하는 것이 아니라 기존에 있는 것들을 collect하여 쓰인 논문들. 학습하기에 좋다.
* communication paper
* 논문 검색 사이트 : DBLP, cite seer 가 CS에서는 가장 큰 사이트

7. 시각화 : pajek - 5000이상의 데이터가 넘어가면 버벅대더라.
* collaborative filtering은 이수원 교수님 랩 쪽이 더 잘 알고 있을 것이다.

:
Posted by Kwang-sung Jun