달력

3

« 2024/3 »

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
2008. 2. 21. 19:34

32번째 netflix prize/일지2008. 2. 21. 19:34

32번째 일지

날짜세는게 귀찮아져서 앞으로는 그냥 이렇게 하기로 마음머겄다.

오늘 처음으로 submission을 날렸다!

최근 작업현황ㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡㅡ
1. global mean from userdata_gen
3.604290
2. global mean from moviedata_gen
3.604290
3.  from global mean, RMSE = 1.129834
4. tried to use QuadProg++, but too complicated.
가장 수상한건 매트릭스 !!!!!!!!!!!!!!!!!!!!
둘째로 수상한것 -> 사용자 데이터를 한박자 늦게 읽는다거나.
매트릭스에서 이상한 결과가 나오거나..
아니면 BestNeighbor[]를 이용하는과정에서 엉뚱한 이웃이 들어갔다든지 또는 NonNegativeQuadraticOpt 이 잘못됐든지..
먼저, QuadProg부터 수정하고 보자.
5. RMSE = 1.308381, 8.296 sec elapsed.( weights are 1 / K )
from global mean, RMSE = 1.129834
6.
RMSE = 1.288206, 10.65321 sec elapsed. (alpha =
2816795 from global mean, RMSE 816796 average prediction = 3.822552
7.
couldn't find 1865(movie) from user scaled 360787(1989766 in user id).. movieID = 1.
해결후
8.
0.949893... k = 10, Beta = 80000 average = 3.677862, Over = 0, Below = 5650.949893... k = 10, Beta = 60000 average = 3.677862, Over = 0, Below = 565(iterations were all 2)
<iterations were all 2> =======> result from odd A(모두 평균값으로  채워져있었다.. 대각은 대각 평균으로, 나머지는 나머지 평균으로..)
9. 자료는 모두 엑셀로 옮겼다.
10. 프로그램을 좀더 테스트에 편하도록 자동화시켰다.
11. 발견한 사실 - shinkage를 낮추니까 Ax=b에서 루프가 매우 조금만 돌고도 답이 나온다.


RMSE K Beta Alpha naïve average average OverRangeCnt BelowRangeCnt
1.086715 20 500 1
0.000000 x x
1.087711 20 500 5
3.811471 x x
1.066420 20 500 5
3.772584 x x
1.062754 15 500 5
3.763922 x x
1.060523 10 500 5
3.751026 x x
1.059561 10 500 5
3.671148 x x
1.058549 10 500 5
3.671544 x x
1.082158 10 50 5
3.679396 x x
1.043956 10 1000 5
3.669001 x x
0.999239 10 5000 5
3.672115 61274 1823
0.977306 10 10000 5
3.671869 33801 1240
0.960570 10 20000 5
3.672174 16041 793
0.951201 10 40000 5
x 8467 631
0.946785 10 80000 5
3.673125 4348 607
0.944558 10 160000 5 3.579016 3.673185 1700 588
0.944167 10 240000 5 3.582144 3.673198 704 582
0.946210 10 240000 10 3.583814 3.673236 704 551
0.943102 10 240000 1 3.579747 3.673172 702 605
0.944175 10 320000 5 3.584546 3.673181 287 576
0.944596 10 480000 5 3.587935 3.673000 18 568
0.945135 10 640000 5 3.590200 3.673006 1 568
0.948938 20 240000 1 3.634656 3.673611 1187 282
0.950472 20 320000 1 3.638476 3.673582 728 277
0.947117 20 160000 1 3.629352 3.673597 2206 290
0.945321 20 80000 1 3.621160 3.673425 4868 303
0.946892 20 40000 1 3.615978 3.673165 9207 329








0.952628 20 320000 1 3.638476 3.638590 728 277

qualifying set.






20 80000 1 3.616442
9908 1773

흠..  신기한건
파라미터들이 별의별 조합을 다이뤄가며 희한한 결과를 만들어낸다는 거다.. 현재 제출한 조합은 맨 아래 있는 것과 같고.....
:
Posted by Kwang-sung Jun