MIT xPROでAI戦略を学ぶ中で「Human-in-the-Loop(HITL)」というキーワードが頻出。
日本ではAIの暴走防止策として語られがちだが、MITではAIを「制御するため」ではなく「進化させるため」の設計思想として扱われる。
このHITLの考え方は、AI開発における新たな視点を提供する。
Metroid Prime 1–3: A Visual Retrospective アートブックがAmazonなどで20%近く割引されています。
この210ページの本には、ゲームのコンセプトアート、キャラクターデザイン、開発秘話などが収録されています。
任天堂とRetro Studiosが協力したこの本は、シリーズの20周年を称えるコレクターズアイテムです。
研究者は、公開された結果を再現しようとする際に、再現性の問題に頻繁に遭遇しています。
例として、ICML 2018の論文「Machine Theory of Mind」を再現しようとした際に、理解できない不一致に直面したことが挙げられています。
著者は、これらの問題が一般的であるか、それとも基本的な理解不足の兆候であるかを評価しようとしています。
投稿者は2026年1月18日に退職するまでの、約12年間のAmazon Web Services Japanでの勤務を振り返っています。
Amazon入社前はNTTデータに4年以上在籍し、システム監視・ジョブ管理のオープンソフトウェア「Hinemos」に携わっていました。
現在はOpen Table Format Study Group (OTFSG) の運営にも関わっています。
Action: Open Table Format Study Group (OTFSG) について調査する。
LLMの表現空間に現れる幾何学的構造(円、1次元多様体など)は、言語統計の並進対称性によって決定されることを理論的に証明しました。
この構造は、共起統計が摂動されてもロバストに存在し、連続的な潜在変数によって制御される場合に自然に現れることを実証しました。
word embeddingモデル、text embeddingモデル、LLMでこの理論的枠組みを実証的に検証しました。
本研究は、密な検索におけるLLM生成テキストへの偏好(「ソースバイアス」)とその要因とされる低パープレキシティについて、制御された評価を通じて検証する。
MS MARCOやLLM生成コーパスでのファインチューニングは、一貫してLLM生成テキストへのランキングシフトを引き起こすが、教師なしモデルではデータセット依存の偏りが見られた。
ソースバイアスは、密な検索モデル固有の性質ではなく、トレーニングによって誘発される現象であり、パープレキシティの説明力は限定的であることが示された。
動画質問応答(VQA)のためのマルチラウンドエージェント「\revise」を提案。フレームの均一サンプリングではなく、少数の情報フレームを選択し、状態を要約しながら対話的に推論を進めます。
ファインチューニングには、EAGER(Evidence-Adjusted Gain for Efficient Reasoning)という、信頼度向上、要約の十分性、早期正解停止を評価するアノテーション不要の報酬メカニズムを導入。
これにより、VQAベンチマークで精度を向上させつつ、使用フレーム数、ラウンド数、トークン数を削減し、効率的なスパース動画推論を実現します。