달력

3

« 2024/3 »

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

'netflix prize/논문 미팅'에 해당되는 글 7

  1. 2008.04.03 황규백 교수님 면담 (7)
  2. 2008.03.26 황규백 교수님 면담 (6)
  3. 2008.03.19 황규백 교수님 면담 (5)
  4. 2008.03.12 황규백 교수님 면담 (4)
  5. 2008.03.05 황규백 교수님 면담 (3)
  6. 2008.02.26 황규백 교수님 면담 (2)
  7. 2008.02.13 황규백 교수님 면담 (1)
2008. 4. 3. 19:10

황규백 교수님 면담 (7) netflix prize/논문 미팅2008. 4. 3. 19:10

  1. 정보과학회에서 나온 형식으로 쓰기
  2. 타이틀 빼고, 저자 작성하기.
  3. 실험: p-norm에서 분수에 루트씌우는 1/p부분 제거하고, alpha값 고려해서 테스트해보기
  4. 수식에 번호삽입
  5. 수식을 이탤릭체로, + Times New Roman
  6. 변수이름이나 k를 모두 이탤릭체로
  7. min w 에서, w를 작게 표시하는법 찾기
  8. 평가값의 정규화를 포함하기
  9. 참고문헌 인용된 순서로 바꾸기으로
  10. 서론에서 기존의 CF에서 이용된 기법을 간단히 설명


오 교수님께서 매우 꼼꼼히 첨삭해 주셨다.
감사합니다.

:
Posted by Kwang-sung Jun
2008. 3. 26. 14:59

황규백 교수님 면담 (6) netflix prize/논문 미팅2008. 3. 26. 14:59

줄거리를 쓰기 시작해야한다.

1. 한문단 가량 collaborative filtering 에 대한 개요(참고문헌 3~4개 정도 채우기)
2. A4용지 한장 반-> 논문을 요약. 순서도 + 수식 + 알고리즘 수도코드(반드시 출처 밝힐 것.)
3. k값의 변화에 대한것, 상관계수방법과 interpolation방법에 의한 것, p - norm변화에 따른 결과. 표 + 이유를 제시

마감: 일요일 까지.

나머지..

1. 데이터 셋에 대한 소개.
2. 전체 참고문헌은 10개 가량으로 요약.

:
Posted by Kwang-sung Jun
2008. 3. 19. 16:28

황규백 교수님 면담 (5) netflix prize/논문 미팅2008. 3. 19. 16:28

1. movielens데이터 적용(최우선).
2. 이메일로 논문 제목 보내기.
3. 논문 지속적으로 읽어보기.
4. p-norm에서 p값을 바꾸어가며 해보기.

5. 통계패키지, R + emacs

6. 각 이웃의 |U(i, j)|가 얼마나 차이나는지... 성능향상을 위한 방법 생각해보기
7. 유사도에서 |U(i, j)|를 두배시켜 사용한다든지, 아니면 조금 낮춘다든지..
8. 영화의 좌우 분산 어느정도로 분포되어있는지, 어느정도 차이나는지 파악하기 또는 그래프 그려보기

. 논문에 들어갈 내용...
 - movielens 데이터, 파라미터 어떤값에서 최적인지, p-norm을 시도한 이야기(p값에 따라.)
 - 앙상블에 대한 시도를 하기에는 부족한 시간.
 - 최적의 k값을 선정하기-> k가 증가할수록 정확해지기때문에 그다지.

:
Posted by Kwang-sung Jun
2008. 3. 12. 16:54

황규백 교수님 면담 (4) netflix prize/논문 미팅2008. 3. 12. 16:54

이제 슬슬 논문을 써야 하니까...


1. p-norm을 이용한 평균계산
2. movielens data 적용
3. 사용자들을 클러스터링 시켜서 그 성향을 반영하는 것
4. sftp이용해서 ml.ssu.ac.kr사용하기.
:
Posted by Kwang-sung Jun
2008. 3. 5. 16:24

황규백 교수님 면담 (3) netflix prize/논문 미팅2008. 3. 5. 16:24

1. 다양한 p값으로 시도하기
2. 데이터 정규화 후 시도하기
3. 교수님께 엑셀파일 보내드리기
4. MovieLens 데이터에 적용시켜보기(probe set은 유져당 최근 5개의 rating을 가져오는 방식을 쓰자.Cross Validation도 언급하셨었다.)
5. 다음주 수요일 오후 2시 미팅.
6. 서버 아이다는 ksjun
:
Posted by Kwang-sung Jun
2008. 2. 26. 15:56

황규백 교수님 면담 (2) netflix prize/논문 미팅2008. 2. 26. 15:56

1. 유사도 변경
 - Corr을 이용한 유사도
 - 유클리드 거리 (2-norm)
 - p-norm (p승하여 시그마한 후에 p승시킴.) : p 값을, 0.4, 0.6, 0.8 시도해본다.

2. 다양한 파라미터로 시도. (파라미터 간의 상관관계가 있는지 여부를 따진다.)

3. 다음주 수요일 2시 미팅.

4. 무비렌즈 데이터에도 적용해보기..
:
Posted by Kwang-sung Jun
2008. 2. 13. 11:36

황규백 교수님 면담 (1) netflix prize/논문 미팅2008. 2. 13. 11:36

1. Ax = b 원래의 복잡한 연산을 매트릭스로 압축시켜놓은 것일 뿐.

2. 공부내용 정리 및 문서화는 어떻게? -> 답없음

3. machine learning 교재 추천. MACHINE LEARNING, McGraw Hill, TOM. M. MITCHELL

4. 교수님께서 논문쓰실때 구현은 - 언제나 C, 행렬처리는 MATLAB을 쓰는것이 더 빠르다.
JAVA 기계학습 라이브러리 - WEKA
S, S+
R (통계 패키지)

5. 논문 -> 정보과학회에 낼 수 있을 것 같다.(2007년에는 4월 17일경에 제출 마감이 있었다.)
학회는 international학회라해서 항상 규모가 있는 것은 아니다. 일단 국내 학회에 낸 후, 국외에 내도 늦지 않다.

다음은 <포스터 발표>

사용자 삽입 이미지

다음은 <구두 발표>
사용자 삽입 이미지

구두 발표


6. 논문 검색 -> 그냥 구글을 이용하는 것이 편하다.
* review article ->새로운 것을 제안하는 것이 아니라 기존에 있는 것들을 collect하여 쓰인 논문들. 학습하기에 좋다.
* communication paper
* 논문 검색 사이트 : DBLP, cite seer 가 CS에서는 가장 큰 사이트

7. 시각화 : pajek - 5000이상의 데이터가 넘어가면 버벅대더라.
* collaborative filtering은 이수원 교수님 랩 쪽이 더 잘 알고 있을 것이다.

:
Posted by Kwang-sung Jun