In Silico
記事
作品
タグ
このサイトについて
RSS
タグ: 評価
ベンチマークが嘘をつくとき
2026/6/8
リーダーボードの数字は現実の代理にすぎない。最適化が始まった瞬間、指標は壊れる。グッドハートの法則とMLの測定問題。
← 全タグ