ai Trend Report

OpenAI News

GPT-5.3-Codex-Sparkの紹介

GPT-5.3-Codex-Sparkの発表リアルタイムコーディングモデルとして、生成速度15倍、コンテキスト128k ChatGPT Proユーザー向けに研究プレビューが提供開始

Action: ChatGPT Proユーザーは、研究プレビューでGPT-5.3-Codex-Sparkを試してみる。

Original: Introducing GPT-5.3-Codex-Spark domain ★★★

Google DeepMind News

Gemini 3 Deep Think: Advancing science, research and engineering

Original: Gemini 3 Deep Think: Advancing science, research and engineering domain ★

NVIDIA Blog

コード、コンピューティング、コネクション：NVIDIA AI Day サンパウロ初開催の舞台裏

NVIDIA AI Daysツアーがブラジル・サンパウロで開催されました。 AI愛好家、開発者、研究者、スタートアップが集結しました。イベントでは、コード、コンピューティング、コネクションといったAI関連のテーマが扱われました。

Action: NVIDIAが提供するAI関連リソースや、開発者向けの今後のイベント情報を調査し、最新技術動向を把握する。

Original: Code, Compute and Connection: Inside the Inaugural NVIDIA AI Day São Paulo domain ★★★

NVIDIA Blog

主要な推論プロバイダー、NVIDIA Blackwell上のオープンソースモデルでAIコストを最大10倍削減

NVIDIA Blackwellプラットフォームとオープンソースモデルの組み合わせにより、AI推論コストを最大10倍削減可能。 AIインタラクションの基盤となるトークンのコスト効率が重要視されており、コスト削減がビジネス継続性の鍵となる。この技術革新は、AIサービスの提供者にとって、より手頃な価格でのサービス提供への道を開く。

Action: AI推論コスト削減のため、オープンソースモデルとNVIDIA Blackwellの組み合わせによるコスト効率化の可能性を調査・評価する。

Original: Leading Inference Providers Cut AI Costs by up to 10x With Open Source Models on NVIDIA Blackwell domain ★★★

NVIDIA Blog

NVIDIA DGX Spark Powers Big Projects in Higher Education

Original: NVIDIA DGX Spark Powers Big Projects in Higher Education domain ★

NVIDIA Blog

GeForce NOWがスクリーンをゲーミングマシンに変える

GeForce NOWは6周年を迎え、今月も記念イベントを継続。 Amazon Fire TVデバイスへの対応と8つの新ゲームが追加され、ストリーミング体験が強化。クラウドゲーミングサービスとして、新たなプラットフォーム展開とコンテンツ拡充を進めている。

Action: クラウドゲーミングサービスの新しいプラットフォーム（例: Amazon Fire TV）への展開や、ストリーミング機能の拡充に関する技術的側面を調査する。

Original: GeForce NOW Turns Screens Into a Gaming Machine domain ★

MIT News - Artificial intelligence

貧困と闘うAIイノベーションのテストとスケール化のためのJ-PALの新しい研究・政策イニシアチブ

J-PALが「Project AI Evidence」を開始し、貧困撲滅のためのAIイノベーションをテスト・拡大します。このイニシアチブは、政府、テクノロジー企業、非営利団体、経済学者が連携するものです。 AIソリューションの評価と改善を通じて、貧困問題の解決を目指します。

Action: AIを活用した貧困削減ソリューションに関する最新の研究動向を調査し、開発に活かせる技術や手法を検討する。

Original: New J-PAL research and policy initiative to test and scale AI innovations to fight poverty domain ★★

MIT News - Artificial intelligence

AIとシミュレーションによる科学の加速

ラファエル・ゴメス＝ボンバレッリ准教授は、AIを科学的発見に応用するキャリアを積んできました。彼は、科学研究におけるAIの活用が現在、大きな転換期にあると考えています。この転換点は、科学発見のプロセスに影響を与えるものです。

Action: AIとシミュレーション技術が科学的発見や研究分野でどのように活用されているか調査し、自身の開発業務への応用可能性を検討する。

Original: Accelerating science with AI and simulations domain ★★

cs.LG updates on arXiv.org

大規模言語モデルは急性虚血性脳卒中後の機能的転帰を予測する

急性虚血性脳卒中後の機能的転帰（mRSスコア）を、入院時の記録テキストから大規模言語モデル（LLM）を用いて予測する研究。ファインチューニングされたLlamaモデルが最高性能を示し、構造化データを用いた既存手法に匹敵する予測精度を達成。この技術は、手動でのデータ抽出を不要とするテキストベースの予後予測ツールの臨床ワークフローへの統合を支持する。

Action: 医療データにおけるLLMを用いた予後予測ツールの開発可能性を探る。

Original: Large Language Models Predict Functional Outcomes after Acute Ischemic Stroke domain ★★★

cs.LG updates on arXiv.org

自律的な数学研究に向けて

高度な基盤モデルにより、AIは国際数学オリンピックレベルの数学的問題を解決可能になりました。本研究では、自然言語での長期的証明生成・検証・改訂を行う数学研究エージェント「Aletheia」を開発しました。 AletheiaはAI生成論文や未解決問題への貢献を通じて、AI支援数学研究における自律性・新規性のレベルを定量化する基準を提案します。

Action: 「Aletheia」のような最先端AI研究エージェントの技術を調査し、将来的にトレンドレポートの収集・分析プロセスへの応用可能性を検討する。

Original: Towards Autonomous Mathematics Research domain ★★

cs.LG updates on arXiv.org

頑健な確率的・テールイベント予測のためのシグネチャカーネルベース評価指標

提案されたSig-MMDとCSig-MMDは、複雑な依存関係を捉え、欠損データやテールイベントに頑健な新しいカーネルベースの評価指標です。従来の評価フレームワークの限界（独立性仮定、テールイベントへの感度不足）を克服します。 CSig-MMDは、予測の適切性を維持しつつテールイベント予測能力を優先し、信頼性の高い多段階予測を促進します。

Action: 提案されたSig-MMDおよびCSig-MMDメトリクスを、既存の時系列予測モデルの評価に適用する可能性を調査する。

Original: Signature-Kernel Based Evaluation Metrics for Robust Probabilistic and Tail-Event Forecasting domain ★★★

cs.LG updates on arXiv.org

Versor: 幾何学的シーケンスアーキテクチャ

Conformal Geometric Algebra (CGA) を活用した新しいシーケンスアーキテクチャ「Versor」が導入されました。既存モデルと比較して、構造的汎化、性能、解釈性、効率性において大幅な改善を達成します。科学モデリングを含む多様なタスクで優れた性能を発揮し、Transformerなどの既存手法を凌駕します。

Action: VersorアーキテクチャとCGAの科学モデリングやSE(3)-等変関係への応用可能性を調査する。

Original: Versor: A Geometric Sequence Architecture domain ★★★

cs.LG updates on arXiv.org

・分散正規化勾配（MVN-Grad）を導入し、学習の安定性と性能を向上させる新しいAdamスタイルのオプティマイザ。・勾配の不確実性に基づく指数移動平均で各座標をスケーリングし、正規化された勾配にモーメンタムを適用することで、従来手法のカップリング問題を解消。・CIFAR-100やGPTスタイルの言語モデリングベンチマークで、Adam、AdaBelief、LaPropを凌駕し、よりスムーズな学習と改善された汎化性能を提供。

Action: MVN-Gradオプティマイザを、既存の機械学習プロジェクト（画像分類や自然言語処理など）に導入し、Adamなどの標準的なオプティマイザと比較して、その効果（収束速度、汎化性能、安定性）を検証する。

Original: Adaptive Optimization via Momentum on Variance-Normalized Gradients domain ★★★

cs.LG updates on arXiv.org

Transformerアーキテクチャからのニューラルネットワーク量子場理論

Transformerの注意機構からユークリッド型スカラー量子場理論をニューラルネットワークで構築する手法を提案。ランダムなネットワークパラメータの平均化によりn点相関関数を定義し、単一アテンションヘッドでの2点・4点相関関数の性質を解析。多数の独立したヘッドを使用すると、非ガウス相関関数が抑制され、大ヘッド極限でガウス型NN-QFTが得られることを示す。

Action: Transformerアーキテクチャを用いた物理シミュレーションや、関連するライブラリ（例：TensorFlow, PyTorch, JAX）の調査・実験を行う。

Original: Neural Network Quantum Field Theory from Transformer Architectures domain ★★

cs.LG updates on arXiv.org

LLMを超える検索拡張モデル（Retrieval-Augmented Models）の推論能力はどの程度か？ハイブリッド知識におけるマルチホップ推論のためのベンチマークフレームワーク

LLMは、最新情報やマルチホップ推論を必要とする知識集約的な質問に苦労しています。 HybridRAG-Benchは、構造化知識グラフと非構造化テキストを組み合わせたハイブリッド知識を拡張したLLMの検索・推論能力を評価するためのフレームワークです。このフレームワークは、モデルのパラメータに知識がエンコードされていること（パラメトリックリコール）ではなく、真の検索と推論を報酬するように設計されており、科学論文などの最新文献に基づいています。

Action: HybridRAG-Benchフレームワークを調査し、AIモデルの知識獲得と推論能力の評価に活用する。

Original: How Much Reasoning Do Retrieval-Augmented Models Add beyond LLMs? A Benchmarking Framework for Multi-Hop Inference over Hybrid Knowledge domain ★★★

cs.LG updates on arXiv.org

LoRAのランクと精度のトレードオフ：勾配フロー解析

LoRAは低ランク更新でも高い精度を示すが、その理論的根拠は未解明な部分が多い。動的システム論と勾配フロー解析を用いて、LoRAのランクと精度の関係を理論的に考察する。本研究では、2つの損失関数について、ランクと精度の間の閉形式の関係を導出し、同時・逐次更新で勾配フロー方程式が同一であることを示す。

Action: LoRAのランクと精度の関係に関する理論的解析結果を、実際のファインチューニングタスクで検証する。

Original: Rank-Accuracy Trade-off for LoRA: A Gradient-Flow Analysis domain ★★

cs.LG updates on arXiv.org

ELROND: 拡散モデルの内部能力の探索と分解

拡散モデルにおける画像生成の制御性を高めるため、ELRONDフレームワークを提案。勾配差分とPCA/Sparse Autoencoderを用いて意味論的な方向性を分離し、生成される画像の微調整を可能にする。モード崩壊の緩和や概念の複雑さの推定にも貢献する。

Action: 拡散モデルにおける画像生成の制御性を高めるため、ELRONDフレームワークの実装または利用を検討する。

Original: ELROND: Exploring and decomposing intrinsic capabilities of diffusion models domain ★★

cs.LG updates on arXiv.org

テンパー・ゼン・ティルト：テンパリングと分類器ガイダンスによる生成モデルの原理的アンラーニング

生成モデルにおけるアンラーニングを密度比推定問題として定式化し、従来の分類器誘導アプローチが集中したデータ分布では失敗しうることを示す。新手法「T3-Unlearning」を提案。ベースモデルを固定し、高信頼度スパイクを平坦化する「テンパリング」と、軽量分類器による「ティルト」を組み合わせる。実験により、T3-Unlearningが集中分布データに対し、アンラーニング品質と生成ユーティリティを向上させ、計算コストも低減することを確認。

Action: 生成モデルのアンラーニング手法「T3-Unlearning」について調査し、その実装可能性やデータプライバシー・モデルセキュリティへの応用を検討する。

Original: Temper-Then-Tilt: Principled Unlearning for Generative Models through Tempering and Classifier Guidance domain ★★★

cs.LG updates on arXiv.org

大規模言語モデルにおけるガイド付き強化学習のためのメタ経験のメモリへの内部化

LLMのRLVR（検証可能な報酬を用いた強化学習）は、エラー帰属と経験の内部化の欠如により、メタ学習のボトルネックに直面しています。提案されたMeta-Experience Learning（MEL）フレームワークは、自己蒸留されたメタ経験を活用し、推論エラーの分岐点を特定し、それらをモデルのメモリに内部化することで、この問題に対処します。 MELは、効果的な知識の再利用と詳細なクレジット割り当てを可能にすることで、一貫してLLMのパフォーマンスを向上させ、ベンチマークで顕著な改善をもたらします。

Action: LLMの推論エラーの特定と、それをメタ経験としてモデルに内部化するメカニズム（例：対照分析、NLL最小化）について調査し、実装の可能性を探る。

Original: Internalizing Meta-Experience into Memory for Guided Reinforcement Learning in Large Language Models domain ★★★

cs.LG updates on arXiv.org

LLMエージェントによる自己進化型レコメンデーションシステム：エンドツーエンドの自律的モデル最適化

大規模レコメンデーションモデルの最適化は、手作業による試行錯誤に大きく依存し、非効率的である。 GoogleのGemini LLMを活用し、モデル変更の自動生成、学習、デプロイをエンドツーエンドで行う自己進化システムを提案する。 YouTubeでの本番導入成功事例により、開発速度とモデル性能の両面で従来手法を凌駕することを確認した。

Action: LLMエージェントを活用した自己進化型モデル最適化の可能性について、YouTubeでの導入事例を参考に、自社システムへの応用を検討する。

Original: Self-Evolving Recommendation System: End-To-End Autonomous Model Optimization With LLM Agents domain ★★★

cs.LG updates on arXiv.org

PRISM: 予測のための構造認識予算配分による差分プライベート合成データ

差分プライバシー(DP)は個人データを保護するが、ノイズの蓄積は予測精度に影響を与える可能性がある。 PRISMは、予測タスクに合わせたDP合成データ生成を可能にし、因果、グラフィカル、または予測レジームを考慮して特徴を選択し、ノイズ予算を配分する新しい手法である。実証実験では、PRISMが汎用的な合成手法と比較して予測精度を大幅に向上させることが示された。

Action: データプライバシーや機械学習モデル開発に関わる開発者は、PRISMのような構造認識DP技術の実装を調査し、モデルの堅牢性とプライバシー保護を向上させることを検討すべきである。

Original: PRISM: Differentially Private Synthetic Data with Structure-Aware Budget Allocation for Prediction domain ★★★

cs.LG updates on arXiv.org

オーディオLMにおけるフレームレベル内部ツール使用による時間的グラウンディング

オーディオLMは時間的グラウンディングタスクで課題を抱えるが、本研究は「フレームレベル内部ツール使用」を提案し、内部表現で直接グラウンディングを行う。これにより、推論速度が50倍以上に向上し、長尺オーディオへの頑健性も実現した。 word localization, speaker diarization, event localizationタスクで既存手法を上回る結果を示した。

Action: 「フレームレベル内部ツール使用」の概念とIHP損失関数について調査し、既存のオーディオ理解タスク（例: 字幕生成、話者分離）への応用可能性を検討する。

Original: Frame-Level Internal Tool Use for Temporal Grounding in Audio LMs domain ★★★

cs.LG updates on arXiv.org

検証可能な報酬を持つマルチ目的RLのためのブロック単位アドバンテージ推定

マルチ目的の構造化生成における報酬干渉とクレジット配分の問題を指摘。各目的ごとにアドバンテージを独立して推定・適用する「ブロック単位アドバンテージ推定」を提案。この手法は、追加のロールアウトなしに、報酬干渉を軽減し、シーケンシャルな目的の最適化を可能にする。

Action: ブロック単位アドバンテージ推定（BAE）手法を、自然言語生成モデルなどの構造化されたシーケンシャルな目的を持つタスクへの応用を検討し、実装の可能性を探る。

Original: Blockwise Advantage Estimation for Multi-Objective RL with Verifiable Rewards domain ★★★

cs.LG updates on arXiv.org

差分プライバシーにおけるリスク均等化合成データ：レコードレベルの影響力制御による外れ値保護

合成データ公開時、稀なケースや異常な特徴を持つ「外れ値」レコードのプライバシー保護が困難である。本論文では、レコードのリスクスコアに基づいて生成器への影響力を調整する「リスク均等化差分プライベート合成」フレームワークを提案する。これにより、特に外れ値レコードに対するメンバーシップ推論攻撃の成功率を大幅に低減し、より堅牢なプライバシー保護を実現する。

Action: 差分プライバシーと合成データ生成における外れ値保護手法について、GitHubなどで実装例や関連ライブラリを調査し、技術的実現可能性を検討する。

Original: Risk-Equalized Differentially Private Synthetic Data: Protecting Outliers by Controlling Record-Level Influence domain ★★

cs.LG updates on arXiv.org

ソースコード埋め込みを用いたプログラミングスキルのモデリングによるコンテキストを考慮した演習推薦

・ソースコード埋め込みを用いてプログラミングスキルをモデル化し、コンテキストを考慮した推薦システムを提案。・学生プロファイルと課題のスキル要件をコサイン類似度でマッチングさせ、未知の課題への推薦を行う。・Jina embeddingsが他の手法より優れ、本システムは正誤や時間に基づくベースラインよりも適切な推薦を提供することを示した。

Action: プログラミング学習プラットフォームに、ソースコード埋め込みを利用したコンテキストアウェアな演習推薦システムを導入することを検討する。

Original: Modeling Programming Skills with Source Code Embeddings for Context-aware Exercise Recommendation domain ★★

cs.LG updates on arXiv.org

COVID-19患者におけるICU移行予測のための胸部X線画像に対するカーネルベース学習

MKLを拡張し、指数型分布に従う応答変数も扱えるGLIMARK（Generalized Linear Models with Integrated Multiple Additive Regression with Kernels）を提案。従来のMKLが連続値のみであった制限を克服し、より多様なデータ型に対応可能。 COVID-19患者の胸部X線画像データにGLIMARKを適用し、ICUへの移行を予測し、臨床的に意味のある特徴を抽出することに成功。

Action: 提案されたGLIMARK手法について調査し、同様の予測タスクに適用可能か検討する。

Original: Kernel-Based Learning of Chest X-ray Images for Predicting ICU Escalation among COVID-19 Patients domain ★★

cs.LG updates on arXiv.org

古典的から不確実性下での位相ニューラルネットワークへ

ニューラルネットワーク、位相データ解析、位相ディープラーニング、およびベイズ統計手法を扱う。軍事ドメインでのAI活用を目指し、画像、時系列、グラフデータ処理に適用。位相と不確実性を考慮したモデルが、堅牢性、解釈性、汎化性能を向上させる。

Action: 位相ディープラーニングやAIモデルにおける不確実性定量化をサポートするライブラリやフレームワークを調査する。

Original: From Classical to Topological Neural Networks Under Uncertainty domain ★★

cs.LG updates on arXiv.org

線形ガウス連鎖モデルにおける係数抽出のためのLLMベンチマーク：Linear-LLM-SCM

線形ガウス構造因果モデル（SCM）における係数抽出（効果量推定）のため、LLMの定量的な因果推論能力を評価するベンチマークフレームワーク「Linear-LLM-SCM」を提案。 LLMは係数推定において結果のばらつきやDAGの誤指定（偽の辺）に弱いという課題があり、定量的なパラメータ化能力には限界があることを実験で示唆。本フレームワークはオープンソース化されており、研究者が容易にLLMの評価を行えるようにする。

Action: オープンソース化されたLinear-LLM-SCMフレームワークを調査し、LLMの因果推論における定量的な能力と限界を理解する。

Original: Linear-LLM-SCM: Benchmarking LLMs for Coefficient Elicitation in Linear-Gaussian Causal Models domain ★★

cs.LG updates on arXiv.org

ペアワイズ比較データから選好学習は何を回収するか？

・ペアワイズ選好学習は、特に言語モデルの調整において機械学習で重要です。・標準的なBradley-Terry (BT) モデルは、データがその仮定に違反する場合、BT学習が何を回収するか不明瞭です。・本論文はCPRDを導入し、BTの妥当性条件と、マージンや接続性などのサンプル効率を決定する要因を特定し、選好学習が回収するものを理解するための基盤を提供します。

Action: Bradley-Terry (BT) モデルが、実際のデータセットに対してどの程度適切か、またCPRD（条件付き選好分布）を調査し、選好学習の理解を深める。

Original: What Does Preference Learning Recover from Pairwise Comparison Data? domain ★★

cs.LG updates on arXiv.org

ニューラルアンサッツによる設定からパフォーマンスへのスケーリング則

既存のスケーリング則は最適化されたハイパーパラメータを前提とするが、現実には困難な場合が多い。 LLMを用いた「ニューラル設定-パフォーマンス・スケーリング則（NCPL）」を提案。これは、完全なトレーニング設定からパフォーマンスへのマッピングであり、予測精度と汎化性能を向上させる。 NCPLは、ハイパーパラメータの共同チューニングを可能にし、損失曲線予測にも拡張可能で、既存手法より優れている。

Action: 自社のトレーニングログを分析し、MLトレーニング設定の最適化におけるLLMの可能性を調査する。

Original: Configuration-to-Performance Scaling Law with Neural Ansatz domain ★★★

cs.LG updates on arXiv.org

ICODEN: 区間打ち切りデータのための常微分方程式ニューラルネットワーク

区間打ち切りデータ（正確なイベント発生時刻が不明）における生存時間予測は、既存手法の仮定や高次元対応の課題を抱えています。 ICODENは、ODEベースのニューラルネットワークで、ハザード関数を柔軟にモデリングし、高次元予測変数でも安定した予測精度を実現します。 ADNIやAREDS2などの生物医学データでの応用例があり、高次元設定での予測やサブグループ識別を可能にする実用的なツールです。

Action: ICODENの論文を調査し、実装や利用可能性について検討する。

Original: ICODEN: Ordinary Differential Equation Neural Networks for Interval-Censored Data domain ★★★

cs.LG updates on arXiv.org

自動報酬整形による、交絡因子に頑健な連続制御

本研究は、強化学習の連続制御問題において、未知の交絡変数が存在するデータセットからでも効果的な報酬整形関数を自動学習する手法を提案します。提案手法では、因果的ベルマン方程式を用いて最適状態値の上界を計算し、これをポテンシャルベース報酬整形(PBRS)のポテンシャルとして活用します。実験により、Soft-Actor-Critic (SAC) と組み合わせた際に、交絡因子の影響下でも堅牢な性能を発揮することを示し、より信頼性の高い連続制御への道を開きます。

Action: 提案手法を実装したGitHubリポジトリ (`https://github.com/mateojuliani/confounding_robust_cont_control`) を調査し、因果的ベルマン方程式やPBRSの概念について理解を深める。

Original: Confounding Robust Continuous Control via Automatic Reward Shaping domain ★★

cs.LG updates on arXiv.org

R2RAG-Flood: Flood Damage Nowcastingのための推論強化、学習不要なRetrieval Augmented Generationフレームワーク

R2RAG-Floodは、嵐後の建物被害の即時予測のための、推論強化・学習不要なRetrieval Augmented Generationフレームワークです。構造化された予測因子、テキスト要約、推論軌跡からなる知識ベースを構築し、推論時には地理的近隣やクラス原型から関連する軌跡を取得してLLMの予測を条件付けます。 2段階の予測プロセス（発生確率と深刻度）で、教師あり学習ベースラインに匹敵する精度を達成し、予測根拠も生成しながら、タスク固有の学習なしに高い効率を示します。

Action: R2RAG-Floodフレームワークのアーキテクチャを調査し、類似のRetriever-Augmented Generation（RAG）技術をweb-file-binプロジェクトのトレンド分析やレポート生成に応用できないか検討する。

Original: R2RAG-Flood: A reasoning-reinforced training-free retrieval augmentation generation framework for flood damage nowcasting domain ★★★

cs.LG updates on arXiv.org

最悪のためのトレーニングを停止せよ：段階的マスキング解除がマスクド拡散モデルのトレーニングを加速

マスクド拡散モデル（MDM）は離散空間での生成モデリングに有望だが、訓練と推論でマスクパターンに不一致があり、学習が複雑で計算コストが高い。本研究では、訓練と推論のマスキングパターンを整合させる「プログレッシブ・アンマスキング（PUMA）」を提案し、推論に合わせたマスクに最適化することで学習を高速化する。 PUMAは1.25億スケールでの事前学習を約2.5倍高速化し、既存の最適化手法とも相補的に機能する。

Action: PUMA手法を調査し、既存の拡散モデル学習パイプラインへの統合可能性を検討する。

Original: Stop Training for the Worst: Progressive Unmasking Accelerates Masked Diffusion Training domain ★★★

cs.LG updates on arXiv.org

大規模言語モデルを用いた生物医学文献におけるエビデンスに基づいたナッジの特定

本論文は、生物医学文献からエビデンスに基づいた行動ナッジを特定・抽出するスケーラブルなAIシステムを提案する。ハイブリッドフィルタリングと量子化LLaMA 3.1 8Bモデルを用いた多段階パイプラインにより、文献の絞り込みと構造化された情報抽出を行う。本システムは、精度と再現率の調整可能なトレードオフを提供し、解釈可能な証拠合成によるパーソナライズドヘルスケアへの貢献を示す。

Action: 大規模なテキストコーパス（例：生物医学文献）から特定の情報（例：行動ナッジ）を抽出するための、ハイブリッドフィルタリングとLLM（例：LLaMA）を組み合わせた多段階パイプラインを構築・評価する。

Original: Identifying Evidence-Based Nudges in Biomedical Literature with Large Language Models domain ★★

cs.LG updates on arXiv.org

不均衡データ下における対照学習の理論的分析：学習ダイナミクスからプルーニングソリューションまで

不均衡データが対照学習の表現品質を低下させ、バイアスを誘発する問題に着目。 Transformerエンコーダーを用いた対照学習の学習ダイナミクスを理論的に分析し、少数派特徴が表現能力を低下させるメカニズムを解明。プルーニング（枝刈り）が、不均衡データによる性能低下を回復させ、特徴分離を向上させる有効な解決策となりうることを理論的・実験的に示唆。

Action: 不均衡データセットを扱う対照学習モデルにおいて、プルーニング技術を適用し、表現品質の向上とバイアス低減の効果を検証する。

Original: Theoretical Analysis of Contrastive Learning under Imbalanced Data: From Training Dynamics to a Pruning Solution domain ★★★

cs.LG updates on arXiv.org

シンプルなLLMベースラインはモデル差分検出で競争力がある

標準的なLLM評価では予期せぬ振る舞いの違いを捉えきれないため、モデル差分検出が重要です。 LLMベース手法とSAEベース手法を比較し、新規評価指標を提案しました。改良されたLLMベースラインがSAEベース手法と同等であり、より抽象的な差分を検出することを示唆しています。

Action: 自身のモデルの予期せぬ振る舞いの変化や、新たなアライメントのずれを特定するため、LLMベースのモデル差分検出手法の実装と評価を検討する。

Original: Simple LLM Baselines are Competitive for Model Diffing domain ★★★

cs.LG updates on arXiv.org

オンデバイスLLM向けハードウェア協調設計スケーリング則：Rooflineモデリングによるアプローチ

オンデバイスLLMでは、精度と効率のバランスを取るためのハードウェア・ソフトウェア協調設計が不可欠である。 Rooflineモデリングを活用し、学習損失と推論レイテンシをモデル化することで、精度とレイテンシの対応関係を確立する新フレームワークを提案。このアプローチにより、アーキテクチャ選定が迅速化され、既存モデルより低いパープレキシティを達成。

Action: 提案されたハードウェア協調設計スケーリング則とRooflineモデリング技術を、特定オンデバイスLLMプロジェクトに適用する実現可能性を調査する。

Original: Hardware Co-Design Scaling Laws via Roofline Modelling for On-Device LLMs domain ★★★

cs.LG updates on arXiv.org

調査データに基づく小児栄養失調予測：深層学習が従来の機械学習手法を上回る

ネパールの小児栄養失調予測において、深層学習モデル（特にTabNet）が従来の機械学習手法を上回る性能を示した。 maternal education, household wealth index, child ageなどが主要な予測因子であり、調査データを用いたスケーラブルなスクリーニングフレームワークを提案。このアプローチはSDGs達成に貢献し、他国の低資源環境にも応用可能である。

Action: 調査対象となったTabNetモデルのアーキテクチャを理解し、他の公衆衛生データセットへの適用可能性を検討する。

Original: Deep learning outperforms traditional machine learning methods in predicting childhood malnutrition: evidence from survey data domain ★★★

cs.LG updates on arXiv.org

EHR時系列データにおけるイベントのタイミング注意を捉えるイベント時間変換器

1.Transformerモデルはイベントのタイミングを考慮しないため、医療分野での個別化されたシーケンシャルイベント発見には限界がある。 2.LITT（Timing-Transformer）は、イベントのタイミングを計算可能な次元として扱い、相対タイムスタンプを割り当てることで、イベントタイミングに焦点を当てた分析を可能にする。 3.このモデルは乳がん患者の心毒性予測において既存手法を上回り、プレシジョン・メディシンの進歩に貢献する。

Action: 時系列データにおけるイベントのタイミングと順序を考慮したTransformerモデル（LITT）を、医療分野などの応用を想定して調査・実装する。

Original: Time-to-Event Transformer to Capture Timing Attention of Events in EHR Time Series domain ★★★

cs.LG updates on arXiv.org

グラフとのカラフルな対話：大規模言語モデルのための人間解釈可能なグラフエンコーディング

LLMはグラフ構造の推論が苦手なため、グラフ問題への適用が課題。人間が理解しやすい色トークンを用いたグラフ構造のテキストエンコーディング手法を提案。提案手法により、グラフタスクにおけるLLMの性能が大幅に向上することを確認。

Action: 提案されたグラフエンコーディング手法を、既存のグラフベースAIプロジェクトやソーシャルネットワーク分析、レコメンデーションシステムなどへの応用を検討する。

Original: Colorful Talks with Graphs: Human-Interpretable Graph Encodings for Large Language Models domain ★★

cs.LG updates on arXiv.org

アフォーダンスによるLLMを用いた部分世界モデリング

大規模言語モデル（LLM）にとって、世界全体を正確にモデル化することは非効率的で不正確である。本研究では、「アフォーダンス」（ユーザーの意図達成に繋がる手掛かり）に基づいた「部分的な世界モデル」がLLMのタスク遂行に有効であることを証明する。ロボット工学の実験で、アフォーダンスを考慮した部分モデルが、全体モデルよりも検索効率と報酬を大幅に向上させることを実証した。

Action: LLMを用いたAIエージェントやロボット制御において、アフォーダンスに基づいた部分世界モデルの概念を調査・実装し、検索効率とタスク達成率の向上を検討する。

Original: Affordances Enable Partial World Modeling with LLMs domain ★★★

cs.LG updates on arXiv.org

材料設計のための統一的かつ解釈可能なアプローチ：テンソル法

材料設計における探索空間の指数関数的な増大と、既存ML手法の解釈性の低さ・不均一サンプリングでの性能低下が課題。テンソル補完法を統一的アプローチとして提案。予測性能はMLに匹敵し、物理現象を解明する解釈可能なテンソル因子を提供。特殊なテンソル手法は不均一サンプリングで汎化性能を向上させ、ベースラインML手法を上回る。

Action: テンソル法が材料設計におけるMLの解釈性と汎化性能の課題を解決する可能性を示唆。このアプローチを、ソフトウェア開発におけるハイパーパラメータチューニング、大規模システム性能分析、または複雑なユーザー行動パターンの解釈などに応用できないか調査する。

Original: Tensor Methods: A Unified and Interpretable Approach for Material Design domain ★★★

cs.LG updates on arXiv.org

光ネットワークにおける障害検出のためのオンライン学習ベースの概念ドリフト適応の実験的実証

光ネットワークの障害検出において、オンライン学習ベースの概念ドリフト適応手法を提案。従来の静的モデルと比較して、パフォーマンスを最大70%向上。低遅延を維持しながら、高性能を実現。

Action: 提案されたオンライン学習ベースの概念ドリフト適応手法について、そのアルゴリズムと光ネットワーク以外への応用可能性を調査する。

Original: Experimental Demonstration of Online Learning-Based Concept Drift Adaptation for Failure Detection in Optical Networks domain ★★★

cs.LG updates on arXiv.org

化学反応予測のためのモジュラーマルチタスク学習

化学反応予測において、大規模言語モデル（LLM）を特定の化学ドメインに適合させることは課題であり、LoRAのようなパラメータ効率の良いファインチューニング手法が、全ファインチューニングと同等の精度を達成しつつ、知識の破滅的な忘却を効果的に抑制することが示されました。 USPTO反応クラスやC-H官能基化反応などの複雑なデータセットでの評価により、LoRAはマルチタスク性能を維持し、学習分布を超えた一般化能力を持つことが確認されました。 LLMのスケールアップが進む中、化学応用における柔軟な展開のため、モジュラーでパラメータ効率の良いファインチューニング戦略の実用性が強調されています。

Action: 化学反応予測のような専門分野に特化したモデル適応のため、LoRAなどのパラメータ効率の良いファインチューニング手法の導入を検討する。

Original: Modular Multi-Task Learning for Chemical Reaction Prediction domain ★★

cs.LG updates on arXiv.org

Transformerにおける正規化のゲート制御による除去：安定学習と効率的推論の実現

Transformerの学習安定化に不可欠とされる正規化について、TaperNormという、正規化を段階的に除去しサンプル非依存の線形マップに移行させる新手法を提案。正規化の主な役割が「スケールアンカー」であり、クロスエントロピーによるlogit成長を防ぐことであることを理論・実証的に示し、auxiliary lossによる代替案も提示。 TaperNormは既存手法と同等の性能を保ちつつ、推論時のモデル層折り畳みにより最大1.22倍のスループット向上を実現し、正規化フリーTransformerへの道を開く。

Action: Transformerベースのモデルの学習安定性と推論効率を向上させる可能性を探るため、TaperNormまたは類似の正規化フリー技術の調査と実験を行う。

Original: Gated Removal of Normalization in Transformers Enables Stable Training and Efficient Inference domain ★★★

cs.LG updates on arXiv.org

LUCID: 事前条件付けられた表現によるアテンション

Transformerモデルにおけるソフトマックスベースのアテンションは長文脈で性能が低下する問題を抱えていた。 LUCIDアテンションは、キー間の類似性から導出される事前条件付けを用いて、アテンション確率を最適化し、長文脈タスクでの性能を大幅に向上させる。約10億パラメータのモデルで128Kトークンまでの評価を行い、BABILongで最大18%、RULERで14%の改善を達成した。

Action: Transformerモデルにおける長文脈処理の性能向上を目的としたLUCIDアテンションの論文を調査し、実装の可能性を検討する。

Original: LUCID: Attention with Preconditioned Representations domain ★★★

cs.LG updates on arXiv.org

LightGTS-Cov：共変量強化型時系列予測

既存の時系列予測モデルは、外部共変量を効果的に扱えないことが多く、特に電力価格や再生可能エネルギー予測のような応用で性能が制限されていました。 LightGTS-Covは、LightGTSを拡張し、過去および将来の共変量を明示的に組み込むことで、この問題を解決します。軽量なMLPプラグインが、デコーディングプロセスを洗練させる形で共変量を統合します。電力価格やエネルギー生成データを用いたベンチマーク、および実際のエネルギー分野での応用において、LightGTS-Covは既存手法を上回り、高い予測精度と安定した運用性能を示しました。

Action: エネルギー分野の時系列予測における共変量利用の重要性を理解し、LightGTS-Covのようなモデルのアーキテクチャ（特にMLPプラグインの役割）を調査・実装する。

Original: LightGTS-Cov: Covariate-Enhanced Time Series Forecasting domain ★★

cs.LG updates on arXiv.org

AIによる算術

最先端AIモデルは高度な数学では優れた性能を示す一方、単純な二数加算のような基本的な算術能力には依然として課題を抱えている。エラーの主な原因は、トークン化に関連するオペランドのずれや、桁上げ処理の失敗であり、これらがエラーの大部分を占める。本研究では、Claude Opus、GPT-5、Gemini 2.5 Proなどのモデルにおけるこれらのエラーを実証的に分析し、その性質を明らかにしている。

Action: AIモデルにおける算術演算の正確性を向上させるため、トークン化や桁上げ処理のメカニズムを詳細に調査・改善する。

Original: AI-rithmetic domain ★★

cs.LG updates on arXiv.org

原子間ポテンシャル向け同変証拠的深層学習

機械学習原子間ポテンシャル(MLIP)における不確実性定量化(UQ)は重要ですが、既存手法には計算コストや性能の課題があります。本研究では、ベクトル値量（原子間力）と不確実性を同時にモデル化し、回転変換下での統計的自己整合性を維持する「同変証拠的深層学習」($ ext{e}^2$IP) を提案します。 $ ext{e}^2$IP は、多様なベンチマークで優れた精度・効率・信頼性のバランスを提供し、データ効率も向上させます。

Action: 関連研究や実装の有無を調査し、将来的な技術スタックへの応用可能性を検討する。

Original: Equivariant Evidential Deep Learning for Interatomic Potentials domain ★★

cs.LG updates on arXiv.org

バイナリフローマッチング：ロバスト学習のための予測-損失空間アライメント

離散データ（バイナリ多様体）に対する生成モデルとして、フローマッチングにおける予測($x$)と速度($v$)目的関数の組み合わせが勾配感度を高める問題を特定しました。予測-損失アライメントを形式化し、目的関数を信号空間($x$-loss)に合わせることで、特異重み付けを排除し、一様サンプリングでのロバストな学習を可能にします。これらの結果は、バイナリおよび関連する離散ドメインでのロバストなフローマッチングのための理論的基盤と実践的なガイドラインを提供し、信号空間アライメントをロバストな拡散学習の鍵として位置づけています。

Action: 「予測-損失アライメント」および「信号空間アライメント」技術を、離散データに対するロバストな生成モデリングに適用する可能性を調査する。

Original: Binary Flow Matching: Prediction-Loss Space Alignment for Robust Learning domain ★★

cs.LG updates on arXiv.org

反発の呪いを解きほぐす：オフポリシー生成推薦のための楽観的分布頑健方策最適化

生成推薦における方策ベースRLは、オフラインログの低品質データによるモデル崩壊に悩まされる。本論文は、低品質データによるモデル崩壊の原因を理論化し、高品質データ特定のための分布頑健最適化（DRO）を提案。提案手法DRPOは、ノイズを厳密に排除して高品質な挙動を回復し、推薦ベンチマークで最先端の性能を示す。

Action: オフポリシーRLやノイズの多いデータを取り扱う応用において、DRPOアプローチの調査を推奨します。

Original: Breaking the Curse of Repulsion: Optimistic Distributionally Robust Policy Optimization for Off-Policy Generative Recommendation domain ★★

cs.LG updates on arXiv.org

QTALE: LLMの量子化ロバスト・トークン適応型レイヤー実行

大規模言語モデル（LLM）は多くのリソースを必要としますが、QTALEはトークン適応型レイヤー実行と量子化を組み合わせることで、その効率化を実現します。 QTALEは、これらの技術を組み合わせた際の精度低下問題に対処するため、新しい学習戦略と推論時の柔軟な実行比率調整メカニズムを導入しています。このフレームワークは、FLOPs削減とメモリ節約を両立させ、ベンチマークでの精度低下を最小限に抑えつつ、LLMの効率的なデプロイを可能にします。

Action: LLMのデプロイ効率化のため、QTALEフレームワークや類似のトークン適応型実行と量子化の統合技術を調査・実験することを検討する。

Original: QTALE: Quantization-Robust Token-Adaptive Layer Execution for LLMs domain ★★★

cs.LG updates on arXiv.org

ランタイム組み込み車両健康監視のためのデュアルストリーム物理拡張教師なしアーキテクチャ

車両の機械的負荷は、走行距離や従来の教師なし学習では捉えきれず、高負荷定常状態による疲労を見逃す。物理プロキシと教師なし学習を融合したデュアルストリームアーキテクチャを提案。多次元ヘルスベクトルで動的異常と持続的負荷を区別する。 RISC-Vプラットフォームで低計算コスト、エッジベース監視を実現。クラウド依存を低減する。

Action: 産業機械やその他の機器の監視にも応用可能。センサーデータと物理ベースの負荷推定モデルを統合し、エッジデプロイメントを検討する。

Original: A Dual-Stream Physics-Augmented Unsupervised Architecture for Runtime Embedded Vehicle Health Monitoring domain ★★

cs.LG updates on arXiv.org

制御強化学習：学習済みSAE特徴ステアリングによるトークンレベルのメカニズム分析

SAE（スパースオートエンコーダー）は、言語モデルの活性化を解釈可能な特徴に分解します。制御強化学習（CRL）を導入し、各トークンでSAE特徴をステアリングすることで、モデル出力の変化を分析する介入ログを生成します。 CRLはGemma-2 2Bで性能向上を達成し、メカニズム解釈ツールとして静的分析を補完する動的な介入プローブを提供します。

Action: この論文で提案されている制御強化学習（CRL）手法をGemma-2 2B以外のモデル（例：LLaMA、Mistral）に適用し、その効果と解釈可能性の向上について検証する。

Original: Control Reinforcement Learning: Token-Level Mechanistic Analysis via Learned SAE Feature Steering domain ★★★

cs.LG updates on arXiv.org

LakeMLB: データレイク機械学習ベンチマーク

大規模機械学習におけるデータレイクの重要性が高まる中、標準化されたベンチマークが不足しています。 LakeMLBは、複数のソースとテーブルを持つデータレイクシナリオに特化した新しいベンチマークであり、多様な統合戦略と実世界のデータセットをサポートします。このベンチマークは、複雑なデータレイク環境での表形式学習手法に関する洞察を提供し、データセットとコードが公開されています。

Action: LakeMLBのGitHubリポジトリを確認し、データレイク環境における機械学習ベンチマークの現状と利用可能性を調査する。

Original: LakeMLB: Data Lake Machine Learning Benchmark domain ★★★

cs.LG updates on arXiv.org

階層的凝集クラスタリングのためのChamfer-Linkage

新しい階層的凝集クラスタリング（HAC）のリンケージ関数としてChamfer-Linkageを提案。従来のリンケージ手法（平均リンケージ、Ward法など）よりも一貫して高品質なクラスタリング結果をもたらすことを実験的に確認。 $O(n^2)$の計算量で、既存手法と同等の効率で実装可能であり、実用的な代替手段となる。

Action: scikit-learnなどのライブラリでChamfer-LinkageをPythonで実装し、カスタムデータセットでの性能を評価する。

Original: Chamfer-Linkage for Hierarchical Agglomerative Clustering domain ★★★

cs.LG updates on arXiv.org

ランダム射影のインフルエンス関数に対する統一理論

大規模モデルにおけるインフルエンス関数計算の計算コスト問題を解決するため、ランダム射影による近似手法の理論的基盤を確立。射影がインフルエンス関数を近似的に保持する条件を統一理論として提示し、正則化や構造化曲率近似との相互作用を解析。射影されたテスト勾配がカーネルの範囲外にある場合の「リーケージ」項を定量化し、実用的なスケッチサイズの選択指針を提供。

Action: 大規模機械学習モデルにおけるインフルエンス関数計算のために、提案されたスケッチサイズ選択理論を適用する方法を調査する。

Original: A Unified Theory of Random Projection for Influence Functions domain ★★★

cs.LG updates on arXiv.org

産業規模最適化モデリングベンチマークの構築

産業最適化問題では、自然言語要件からコードへの翻訳が困難であり、既存のベンチマークは小さすぎる。 MIPLIB-NLは、実際の産業問題から逆構築手法を用いて派生した新しいベンチマークであり、LLMをより現実的に評価するために導入された。実験により、LLMは新しいベンチマークで性能が著しく低下することが示され、小規模評価では見えなかった限界が露呈した。

Action: MIPLIB-NLベンチマークと、LLMを用いた最適化モデリングにおけるその応用について調査し、大規模問題でのLLMの性能限界を理解する。

Original: Constructing Industrial-Scale Optimization Modeling Benchmark domain ★★★

cs.LG updates on arXiv.org

分布レベルの物理的事前情報を持つマルチモーダル条件付き混合モデル

物理システムにおける多峰性（複数の状態やメカニズム）を扱うための、混合密度ネットワーク（MDN）を用いた新しい条件付きモデリングフレームワークを提案。物理法則や方程式を正則化項として組み込むことで、モデルに物理的整合性と解釈可能性を付与し、データが限られる場合でも有効。本手法は、非線形力学系、確率偏微分方程式、衝撃ダイナミクスなどの科学的問題に適用可能であり、既存の生成モデルと比較しても遜色ない性能と高い解釈性を示す。

Action: 物理法則を組み込んだマルチモーダル条件付き混合モデル（MDNベース）の実装方法について調査し、自身の研究分野への応用可能性を検討する。

Original: A Multimodal Conditional Mixture Model with Distribution-Level Physics Priors domain ★★

cs.LG updates on arXiv.org

ニューラルネットワーク予測の公平性：逆事実データセット生成による分析

深層ニューラルネットワークの公平性を分析するため、訓練データのラベルを変更して予測の変化を観察する「逆事実データセット」を生成する新しい手法を提案。この手法は、ラベルバイアスの影響を特定することで公平性を評価し、バイアスのかかったラベルが予測にどう影響するかを明らかにする。少数の訓練ラベルを効率的に変更して逆事実データセットを構築し、開発者がデータセットのバイアスを調査し、重要な訓練例を理解できるようにする。

Action: 開発者は、この逆事実データセット生成手法を自社のAIモデルにおけるバイアス検出に応用できないか検討し、その実装方法を調査すべきである。

Original: Analyzing Fairness of Neural Network Prediction via Counterfactual Dataset Generation domain ★★★

cs.LG updates on arXiv.org

潜在フローマッチングによる反応軌跡の駆動

「LatentRxnFlow」という新しい反応予測パラダイムを提案。反応を反応物から熱力学的生成物状態への連続的な潜在軌跡としてモデル化する。メカニズム注釈なしで、条件付きフローマッチングを用いて反応物・生成物ペアから時間依存の潜在ダイナミクスを学習する。予測精度で最先端の性能を達成しつつ、軌跡レベルの診断により失敗モードの特定、不確実性の認識を可能にし、より信頼性の高い発見ワークフローに貢献する。

Action: LatentRxnFlowモデルとConditional Flow Matching技術を、科学モデリング・シミュレーションソフトウェアへの統合可能性や不確実性定量化の観点から調査する。

Original: Driving Reaction Trajectories via Latent Flow Matching domain ★★★

cs.LG updates on arXiv.org

ニューラル特性関数を用いたグラフドメイン適応における適応型分布アライメント学習

グラフドメイン適応 (GDA) における複雑な分布シフトに対処するため、ADAlign という適応型分布アライメントフレームワークを提案。手動設計されたフィルターに依存する従来手法とは異なり、ADAlign はニューラルスペクトル不一致 (NSD) メトリックを用いて、属性、構造、依存関係の関連する差異を自動的に特定・アライメント。実験では、既存手法を上回り、効率性も向上。

Action: ADAlignフレームワークとNSDメトリックのグラフドメイン適応における有効性を、既存のグラフニューラルネットワークライブラリ（例: PyTorch Geometric, DGL）を用いて評価する。

Original: Learning Adaptive Distribution Alignment with Neural Characteristic Function for Graph Domain Adaptation domain ★★

cs.LG updates on arXiv.org

Transformer学習ダイナミクスにおける低次元実行多様体：モジュラー算術タスクからの証拠

過剰パラメータ化されたTransformerモデルの学習ダイナミクスは、高次元空間にもかかわらず、3-4次元の低次元実行多様体に急速に収束することが、モジュラー算術タスクを用いて示された。この幾何学的構造は、注意集中のメカニズム、SGDの挙動、およびスパースオートエンコーダーの特性を統一的に説明する。本研究は、Transformerの学習を理解するための幾何学的フレームワークを提案し、解釈可能性や学習カリキュラム設計への示唆を与える。

Action: Transformerモデルの学習における低次元実行多様体の発見を、モデルの解釈性向上や効率的な学習カリキュラム設計にどのように応用できるか調査・検討する。

Original: Low-Dimensional Execution Manifolds in Transformer Learning Dynamics: Evidence from Modular Arithmetic Tasks domain ★★★

cs.LG updates on arXiv.org

Webからのマルチビュー地理空間表現学習によるDiDiでの配車予測の強化

配車予測における地理的異質性や外部イベントの影響に対処するため、MVGR-Netという新しいフレームワークを提案。 MVGR-Netは、POI（注目すべき地点）と時間的移動パターンを統合して地理空間表現を学習する。学習した表現と外部イベントを用いてLLMをファインチューニングし、DiDiのデータセットで最先端の性能を実証。

Action: DiDiのような配車サービスにおけるMVGR-Netフレームワークの適用性や、同様の地理空間予測タスクへの応用可能性について調査する。

Original: Enhancing Ride-Hailing Forecasting at DiDi with Multi-View Geospatial Representation Learning from the Web domain ★★★

cs.LG updates on arXiv.org

グラフドメイン適応のための構造-意味進化軌跡の学習

グラフドメイン適応（GDA）における、グラフ構造の連続的・非線形な進化への対応が課題であった。提案手法DiffGDAは、拡散モデルと確率微分方程式（SDEs）を用いてグラフの進化を連続時間でモデル化し、ドメイン適応プロセスを最適化する。 14のタスクで最先端手法を上回る性能を示し、実データセットで有効であることを実証した。

Action: DiffGDAの理論的背景（SDEs、拡散モデル）と、グラフ構造の連続的進化を扱う手法を理解し、将来的なMLモデル開発への応用可能性を検討する。

Original: Learning Structure-Semantic Evolution Trajectories for Graph Domain Adaptation domain ★★

cs.LG updates on arXiv.org

カットを排除しない：LLMベースの定理証明における指数関数的分離

LLMを活用した定理証明の理論的解析を行い、タクティク提案をMDPとしてモデル化しました。再利用可能な証明構造（証明DAG）を持つ問題分布を導入し、成功確率の下限を導出しました。カット（lemma/sketch）を保持する学習器は、カットフリー学習器よりも指数関数的に少ないデータで済むことを示し、エージェント型定理証明器のサブゴール分解を正当化します。

Action: LLMベースの定理証明におけるカット除去の重要性に関する理論的根拠を調査し、関連するエージェント型定理証明器（Leanなど）におけるサブゴール分解手法の実装可能性を検討する。

Original: Don't Eliminate Cut: Exponential Separations in LLM-Based Theorem Proving domain ★★

cs.LG updates on arXiv.org

「プロセスを優先せよ、結果だけではなく：潜在的な思考軌跡への報酬付与がループ言語モデルの推論を改善する」

ループ言語モデル(LoopLMs)は多段階推論で優位性を持つが、既存の強化学習(RL)手法では最終結果のみに報酬が与えられ、性能向上が課題だった。新フレームワーク「RLTT」は、推論の全潜在的思考軌跡に報酬を分散させることで、この課題を解決し、精緻な報酬割り当てを実現する。 RLTTはOuro-2.6B-Thinkingモデルで、数学的推論ベンチマークにおいて目覚ましい精度向上 (+14.4% on MATH-500) を示し、非数学的推論への汎用性も証明した。

Action: RLTTフレームワークをLLMのファインチューニングや推論タスクへの応用を調査・実験する。

Original: Prioritize the Process, Not Just the Outcome: Rewarding Latent Thought Trajectories Improves Reasoning in Looped Language Models domain ★★★

cs.LG updates on arXiv.org

脳波に基づくパーキンソン病予測におけるドメイン一般化を改善するためのスワップ敵対的フレームワーク

ECoGを用いたパーキンソン病(PD)予測の可能性と、再現性のあるベンチマークデータセットの必要性を指摘。被験者間変動とHDLSS問題に対処するため、ISBCSとドメイン敵対的学習を組み合わせた新フレームワーク「SAF」を提案。提案手法はECoGおよびEEGデータセットで既存手法を大幅に上回る汎化性能を示し、PD予測の精度向上に貢献。

Action: 公開予定のPD予測用ECoG/EEGデータセットとSAFフレームワークのソースコードを入手し、提案手法の再現性と応用可能性を評価する。

Original: A Swap-Adversarial Framework for Improving Domain Generalization in Electroencephalography-Based Parkinson's Disease Prediction domain ★★★

cs.LG updates on arXiv.org

Residual Reinforcement LearningにおけるValue Learningの効率化の要因は何か？

Residual RLは、ベースポリシーを固定し、有界な補正のみを学習することで、表現力豊かな事前学習済みポリシーの安定したオンライン改良を可能にします。 Residual RLにおけるValue学習は、「コールドスタート病理」や「構造的スケールミスマッチ」といった課題に直面します。提案されたDAWNアプローチは、ベースポリシー遷移によるウォームアップとクリティック正規化によりこれらの課題に対処し、効率の向上をもたらします。

Action: Residual RLにおけるValue Learningの効率化手法であるDAWN (Data-Anchored Warmup and Normalization) について調査し、実装を検討する。

Original: What Makes Value Learning Efficient in Residual Reinforcement Learning? domain ★★

cs.LG updates on arXiv.org

圧縮と精度のパラドックスを橋渡しする：測定精度の保証付き臨床EEGレポート生成のためのハイブリッドアーキテクチャ

臨床EEGレポート生成では、LLMのコンテキストウィンドウ制限による圧縮が時間精度を破壊し、誤った測定値につながる問題がある。本研究では、信号処理による正確な値抽出とクロスモーダルブリッジを組み合わせたハイブリッドアーキテクチャを提案し、圧縮前精度を保証する。このシステムは、誤報を60%削減し、検出速度を50%向上させ、臨床測定精度を保証する。

Action: 信号処理とクロスモーダルブリッジを組み合わせたハイブリッドアーキテクチャの概念を調査し、EEGレポート生成における臨床測定精度の保証を可能にする実装方法を検討する。

Original: Bridging the Compression-Precision Paradox: A Hybrid Architecture for Clinical EEG Report Generation with Guaranteed Measurement Accuracy domain ★★★

cs.LG updates on arXiv.org

小型モデルのµスケーリング：原則に基づいたウォームスタートとハイパーパラメータ転移

学習済み小型ニューラルネットワークを大型モデルにスケールアップすることで、推論予算に応じて効率化を図る手法を提案。スケールアップ時のハイパーパラメータ調整コストを削減するため、原則に基づいたアプローチとµTransfer技術を拡張。提案手法は理論的裏付けを持ち、現実的なデータセットとアーキテクチャで有効であることを実証。

Action: 提案されているモデルアップスケーリング手法とµTransferによるハイパーパラメータ転移技術について、その理論的背景と実装の詳細を調査し、我々のプロジェクトへの適用可能性を検討する。

Original: $\mu$pscaling small models: Principled warm starts and hyperparameter transfer domain ★★★

cs.LG updates on arXiv.org

JaccardスコアベースのSigmoid損失を用いたマルチラベルECG分類のための対照学習

・大規模言語モデル（LLM）の進歩により、マルチモーダル医療AIが発展。本研究では、ECG分類の限界を克服するため、SigLIPモデルとJaccardスコアベースのSigmoid損失を改良し、マルチラベル予測の精度向上を目指す。・既存のMedGeminiなどのモデルがECGデータに対応していない、または精度が限定的である課題に対し、実世界の病院データを用いた頑健なECGエンコーダを構築。・言語モデルへの医療知識の統合と改良された損失関数、埋め込み次元の増加、ランダムクロッピングの適用により、マルチラベルECG分類の性能が大幅に向上することを示した。

Action: JaccardスコアベースのSigmoid損失のような改良された損失関数を用いた対照学習を、他のドメインにおけるマルチラベル分類問題に適用する可能性を調査する。

Original: Contrastive Learning for Multi Label ECG Classification with Jaccard Score Based Sigmoid Loss domain ★★

cs.LG updates on arXiv.org

オンライン最小最大最適化：個々の後悔から累積サドルポイントへ

オンライン最小最大最適化における、静的二重性ギャップ(SDual-Gap$_T$)および動的サドルポイント後悔(DSP-Reg$_T$)を提案・研究。強凸強凹条件や指数関数的凹性（EC）下でのアルゴリズムによる性能限界を導出。動的後悔と互換性のある個人後悔に対応するため、双方向Pólyak-Łojasiewicz (PL)条件に関する限界を確立。

Action: これらのオンライン最適化手法の応用可能性を調査し、必要であれば関連ライブラリの選定や実装を検討する。

Original: Online Min-Max Optimization: From Individual Regrets to Cumulative Saddle Points domain ★

cs.LG updates on arXiv.org

LLM時代のガウス・ニュートン学習除去

LLMの学習除去手法であるガウス・ニュートン法（K-FADE）は、不都合な出力を抑制しつつ、他のデータセットでの性能低下を最小限に抑えます。 K-FADEは、モデルの出力ではなく重みに制約を課すことで、学習対象外のデータセットへの影響を低減します。この手法は、追加学習後も学習除去の状態を維持でき、継続的な管理を容易にします。

Action: K-FADE (K-FAC for Distribution Erasure) の概念を理解し、LLMの学習除去への応用可能性を調査する。

Original: Gauss-Newton Unlearning for the LLM Era domain ★★★

cs.LG updates on arXiv.org

物理情報付きトークン正則化方策最適化によるLLMベースの科学方程式発見

LLM を用いた科学方程式発見手法「PiT-PO」を提案。物理情報とトークン正則化を組み合わせ、強化学習で LLM を適応的に進化させる。生成される方程式の物理的一貫性と構造的簡潔性を保証し、標準ベンチマークで最先端の性能を達成。流体ダイナミクスにおける新しい乱流モデルを発見し、小規模モデルでも大規模モデルを凌駕できる可能性を示唆、科学的発見の民主化に貢献。

Action: LLMに物理的制約や構造的制約を組み込んで、より信頼性の高い科学的発見を促進するPiT-POのようなアプローチを、自身のLLMベースのアプリケーション開発にどう応用できるか調査・検討する。

Original: LLM-Based Scientific Equation Discovery via Physics-Informed Token-Regularized Policy Optimization domain ★★★

cs.LG updates on arXiv.org

勾配クリッピングが深層学習における差分プライバシーの制御メカニズムとなる時

深層学習における差分プライバシー（DP-SO）の学習では、勾配クリッピングとノイズ注入が重要だが、クリッピング閾値の設定が最適化バイアスや精度低下を招く。提案手法は、重みのみのスペクトル診断を用いた軽量な制御駆動型クリッピング戦略で、閾値を適応的に更新する。この手法は、追加の計算オーバーヘッドなしにプライバシー損失を増加させずに、学習の安定性と精度を向上させる。

Action: 提案されている勾配クリッピングによる差分プライバシー制御手法の軽量性と効果を、既存のDP-SGD実装に適用して検証する。

Original: When Gradient Clipping Becomes a Control Mechanism for Differential Privacy in Deep Learning domain ★★★

cs.LG updates on arXiv.org

ニューラル加法エキスパート：制御可能なモデル加法のためのコンテキストゲート付きエキスパート

本論文は、機械学習における解釈可能性と精度のトレードオフに対処するため、ニューラル加法エキスパート（NAEs）を提案します。 NAEsは、厳密な加法性と特徴量間の相互作用のバランスを取るために、ゲート機構を備えたエキスパート混合アプローチを使用します。予測精度と透明な特徴量貢献度の間で最適なバランスを実現し、コードはGitHubで利用可能です。

Action: NAEフレームワークのGitHubリポジトリを確認し、解釈可能で高精度なモデル構築への応用可能性を検討する。

Original: Neural Additive Experts: Context-Gated Experts for Controllable Model Additivity domain ★★★

cs.LG updates on arXiv.org

TRACE: 共変シフト効果下での理論的リスク帰属

研究は、モデルがシフトしたデータで再学習された場合のパフォーマンス変化を分析します。 TRACEフレームワークは、リスク変化を4つの要因（一般化ギャップ、モデル変更ペナルティ、共変シフトペナルティ）に分解し、原因を診断します。提案されたデプロイゲートスコアは、モデル交換の安全性を高めるためのパフォーマンス低下予測に有効です。

Action: モデルのパフォーマンス変化を理解し、安全なモデル交換のためのデプロイゲートを実装・評価する。

Original: TRACE: Theoretical Risk Attribution under Covariate-shift Effects domain ★★★

cs.LG updates on arXiv.org

粗さ指標に基づく連合学習

・連合同学習(FL)における非IIDデータ問題とクライエントドリフトに対処するため、損失関数の「粗さ」を指標とするRI-FedAvgアルゴリズムを提案。・RI-FedAvgは、ローカル学習目標に粗さ指標(RI)に基づく正則化項を導入し、不均一な環境下での頑健な最適化を保証。・MNIST, CIFAR等の実験で、既存手法を上回る精度と収束速度を示し、実環境でのFLの堅牢性と効率性を向上。

Action: RI-FedAvgアルゴリズムの実装を検討し、非IIDデータセットにおけるモデルの収束性と頑健性を評価する。

Original: Roughness-Informed Federated Learning domain ★★

cs.LG updates on arXiv.org

混合密度学習：自然勾配期待値最大化によるアプローチ

混合密度ネットワーク（MDN）の学習を、情報幾何学と期待値最大化フレームワーク、および自然勾配降下法を統合したnGEM（natural gradient expectation maximization）目的関数を用いて改善する。 nGEMは、従来のNLL（負対数尤度）学習に比べて、収束速度が最大10倍向上し、計算オーバーヘッドはほぼゼロである。この手法は、高次元データに対してもNLLが失敗する状況で有効であり、スケーラビリティが高い。

Action: 混合密度ネットワーク（MDN）に、論文で提案されている自然勾配期待値最大化（nGEM）目的関数を実装し、従来のNLL学習との収束速度や高次元データへの適用性を比較評価する。

Original: Learning Mixture Density via Natural Gradient Expectation Maximization domain ★★★

cs.LG updates on arXiv.org

dnaHNet: ゲノム配列学習のためのスケーラブルかつ階層的な基盤モデル

dnaHNetは、ゲノム配列をエンドツーエンドでセグメント化・モデル化する、トークナイザーフリーの自己回帰モデルです。微分可能な動的チャンキング機構により、計算コストを抑えつつ、予測精度を維持しながらゲノム配列を効率的に圧縮します。タンパク質変異フィットネスや遺伝子必須性の予測において、教師なしで階層的な生物学的構造を発見し、既存モデルを凌駕する性能を示します。

Action: dnaHNetの動的なチャンキング機構を、他のシーケンスモデリングタスク（自然言語処理など）に応用可能か調査し、可能であれば実験する。

Original: dnaHNet: A Scalable and Hierarchical Foundation Model for Genomic Sequence Learning domain ★★★

cs.LG updates on arXiv.org

深層ニューラルネットワークのための階層的ゼロ次最適化

深層学習におけるゼロ次（ZO）最適化の計算量問題を解決するため、階層的ゼロ次（HZO）最適化を提案。ネットワークを分割する「分割統治」戦略により、計算複雑性を $O(ML^2)$ から $O(ML \log L)$ へ大幅に削減。 CIFAR-10やImageNetでの評価で、誤差解析により数値安定性を維持しつつ、誤差逆伝播法と同等の精度を達成。

Action: 提案された階層的ゼロ次（HZO）最適化手法を深層学習モデルの訓練に適用し、その有効性と性能を評価する。

Original: Hierarchical Zero-Order Optimization for Deep Neural Networks domain ★★★

cs.LG updates on arXiv.org

物理情報ニューラルネットワークにおける物理とデータの一貫性の役割

物理情報ニューラルネットワーク（PINNs）は、データ不足のPDEモデリングで物理制約を活用するが、ノイズ等によるデータと物理法則の不一致が精度に影響する。本研究では、データとPDEの不一致がPINNsの精度を制限する「一貫性バリア」を導入し、その影響を分析した。高精度データを用いれば、PINNsは物理構造を回復し、データ不一致による誤差飽和を防げることを示し、データ品質と物理制約の相互作用を明らかにした。

Action: PINNsの学習において、データ品質の評価方法を調査し、一貫性バリアの影響を軽減するための前処理手法を検討する。

Original: On the Role of Consistency Between Physics and Data in Physics-Informed Neural Networks domain ★★

cs.LG updates on arXiv.org

作業記憶における認知負荷のための瞳孔計測と脳ダイナミクス

作業記憶における認知負荷を瞳孔計測とEEGで評価。瞳孔計測単独でもEEGに匹敵し、携帯性と拡張性に優れる実用的な代替手段となり得ることを示唆。解釈可能なモデル（Catch-22特徴、SHAP）を用いた特徴ベースのアプローチが、深層学習モデルよりも優れた分類性能と生理学的な洞察を提供。これらの結果は、neuropsychiatry（精神神経医学）、教育、ヘルスケア分野での、ウェアラブルで手頃な価格の認知モニタリングシステムの開発を支持する。

Action: ウェアラブルデバイスで利用可能な瞳孔計測データと解釈可能な機械学習モデルを組み合わせ、認知負荷モニタリングシステムを開発・評価するためのPoC（概念実証）を検討する。

Original: Pupillometry and Brain Dynamics for Cognitive Load in Working Memory domain ★★

cs.LG updates on arXiv.org

Mitigating Reward Hacking in RLHF via Bayesian Non-negative Reward Modeling

Original: Mitigating Reward Hacking in RLHF via Bayesian Non-negative Reward Modeling domain ★

cs.LG updates on arXiv.org

中程度の患者データでトレーニングされた生成臨床時系列モデルはプライバシーを保護する

医療データの共有はプライバシーリスクのため困難だが、生成AIによる合成データが解決策となりうる。しかし、生成モデル自体がプライバシーを完全に保証するわけではなく、差分プライバシー(DP)は有用性を損なう場合がある。本研究では、中程度のデータセットで訓練されたモデルに対するプライバシー攻撃が無効であることを実証し、DPの限界と有用性について考察する。

Action: 医療分野における生成AIモデルのプライバシー監査手法を調査し、差分プライバシー(DP)とモデルユーティリティのトレードオフを理解する。

Original: Generative clinical time series models trained on moderate amounts of patient data are privacy preserving domain ★★

cs.LG updates on arXiv.org

粗視化ボルツマン生成器

既存のボルツマン生成器(BG)はスケーラビリティに課題があり、粗視化モデルは統計的正確性を欠く。提案された粗視化ボルツマン生成器(CG-BG)は、スケーラブルな低次元モデリングと正確な重要度サンプリングを統合する。学習されたPMFを利用し、より大きな分子システムを偏りなくサンプリングするためのスケーラブルな道筋を示す。

Action: 分子動力学シミュレーションにおける粗視化モデルと生成モデルの統合手法(CG-BG)の概念を理解し、自社開発のAIモデルやデータ処理パイプラインへの応用可能性を調査する。

Original: Coarse-Grained Boltzmann Generators domain ★★

cs.LG updates on arXiv.org

合成縦断的患者データにおける時間的保存の評価指標

・合成縦断的患者データにおける時間的特性の保存を評価する指標を提案。・提示された指標は、限界構造、共分散、個人レベル、測定構造を評価。・多次元的な評価が合成データの品質を包括的に理解するために不可欠であることを示唆。

Action: 合成縦断的患者データ生成モデルの評価に、提案された多次元的な評価指標を導入・検討する。

Original: Evaluation metrics for temporal preservation in synthetic longitudinal patient data domain ★★

cs.LG updates on arXiv.org

ドメイン知識誘導型ベイズ最適化による複雑な科学機器の自律アライメント

高次元で連成した非対称な最適化問題における性能低下を克服するため、ドメイン知識誘導型ベイズ最適化（BO）アプローチを提案。物理的洞察を活用して座標変換を行い、入力特徴量を分離・アクティブサブスペースを一次探索軸に整列させることで、探索を単純化。12次元の困難な光学システムで有効性を実証。リバースアニーリング探査戦略と組み合わせることで、グローバル最適解に確実に収束。複雑な科学機器の自動チューニングのための汎用的なパラダイムを提供する。

Action: 高次元で連成したパラメータを持つ既存の内部システムやプロセスにおいて、物理的洞察に基づく座標変換を応用し、最適化の効率化を図る。

Original: Domain Knowledge Guided Bayesian Optimization For Autonomous Alignment Of Complex Scientific Instruments domain ★★★

cs.LG updates on arXiv.org

VESPO：安定したオフポリシーLLMトレーニングのための変分シーケンスレベルソフトポリシー最適化

大規模言語モデル（LLM）の強化学習（RL）における学習安定性の課題（ポリシーの遅延、非同期学習など）に対処するため、変分シーケンスレベルソフトポリシー最適化（VESPO）を提案。分散削減を導入し、シーケンスレベルの重要度重み付けを直接操作する「VESPO」により、理論的基盤の欠如を解消。数学的推論ベンチマークにおいて、64倍の学習遅延比率や完全非同期実行下でも学習を安定させ、一貫した性能向上を確認。

Action: arXivの論文を読み、提案手法(VESPO)の理論的背景と実装について調査する。

Original: VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training domain ★★★

cs.LG updates on arXiv.org

正規化フローと層化を用いた推定不確実性の低減

現在の統計的推定手法は、データの分布（例：ガウス分布）に関する仮定に依存しており、これらの仮定が誤っている場合に不確実性をもたらします。新しいフローベースモデルと層化サンプリングを組み合わせた手法は、ニューラルネットワークを用いて柔軟な分布モデリングを行い、推定不確実性を低減します。このモデルは、特に高次元データにおいて、モンテカルロ法やガウス混合モデルなどの既存手法を上回る性能を示します。

Action: https://github.com/rnoxy/flowstrat のリポジトリを調査し、正規化フローと層化サンプリングを用いた推定不確実性低減手法の実装を確認する。

Original: Reducing Estimation Uncertainty Using Normalizing Flows and Stratification domain ★★★

cs.LG updates on arXiv.org

解釈可能なグラフレベル異常検出：正常プロトタイプとの対比による

グラフレベル異常検出（GLAD）において、既存の深層学習手法はブラックボックスであるという課題がある。新提案のProtoGLADは、正常なプロトタイプグラフとの対比により、異常検出結果の解釈可能性を高める手法である。実験により、ProtoGLADは最先端手法と同等の検出性能を示しつつ、人間が理解しやすい説明を提供する。

Action: ProtoGLADの論文を調査し、グラフレベル異常検出への応用可能性について検討する。

Original: Interpretable Graph-Level Anomaly Detection via Contrast with Normal Prototypes domain ★★★

cs.LG updates on arXiv.org

SnapMLA：ハードウェア認識FP8量子化パイプラインによる効率的な長コンテキストMLAデコーディング

SnapMLAは、長コンテキストMLAデコーディングにおけるFP8注意機構の統合課題を解決するフレームワークです。 RoPE認識トークンごとKV量子化、量子化PV計算パイプライン再構築、データフロー最適化により、ハードウェアを意識したアルゴリズムとカーネルの協調最適化を行います。最先端MLA LLMでの実験により、長コンテキストタスク（数学的推論、コード生成）で最大1.91倍のスループット向上を達成し、パフォーマンス低下のリスクは無視できるレベルです。

Action: SnapMLAフレームワークを調査し、LLM推論の長コンテキスト効率化への応用可能性を評価する。

Original: SnapMLA: Efficient Long-Context MLA Decoding via Hardware-Aware FP8 Quantized Pipelining domain ★★★

cs.LG updates on arXiv.org

Rising Multi-Armed Bandits with Known Horizons

Original: Rising Multi-Armed Bandits with Known Horizons domain ★

cs.LG updates on arXiv.org

カルマン線形アテンション：効率的な言語モデリングと状態追跡のための並列ベイズフィルタリング

MambaやGLAのような効率的なモデルは、複雑な推論に必要な表現力や頑健な状態追跡が不足している。カルマンフィルタを並列計算可能に再定式化することで、不確実性を伴う信頼性の高い状態追跡を実現。新しいKLAレイヤーは、GLAの計算的利点を維持しつつ、より表現力豊かで非線形な更新とゲーティングを提供する。

Action: 新しいKLAレイヤーを既存の言語モデルに実装し、その効果を検証する。複雑な推論や状態追跡が求められるタスクにKLAを適用する可能性を探る。

Original: Kalman Linear Attention: Parallel Bayesian Filtering For Efficient Language Modelling and State Tracking domain ★★★

cs.LG updates on arXiv.org

連続パラメータからの整数予測

連続パラメータから整数ラベル（例: ソーシャルメディアの「いいね」数、自転車シェアの空き台数）を予測する問題に焦点を当てる。ニューラルネットワークで利用できるよう、離散分布のパラメータを連続値として予測する手法を調査する。 Bitwise分布や離散ラプラス分布のアナログが、画像生成などのタスクで有効であることを発見した。

Action: Bitwise分布や離散ラプラス分布などの整数予測に特化したニューラルネットワークモデルを、画像生成タスクに適用して評価する。

Original: Predicting integers from continuous parameters domain ★★

cs.LG updates on arXiv.org

グラフニューラルネットワークにおける適応的再配線の影響を探る

グラフニューラルネットワーク（GNN）のメモリ使用量と計算コストを削減するため、ネットワーク科学と機械学習の技術を用いたスパシフィケーション（疎化）による正則化手法を探求しています。電力網の信頼性評価のような実世界の応用を対象に、GCNやGINモデルの効率化を示し、スパース性パラメータの調整の重要性を強調しています。適応的再配線アプローチは、学習中にモデルの接続構造を適応させる可能性を示唆しており、特に早期停止と組み合わせることで有望です。

Action: GNNのスパース性および適応的再配線手法を、自身のプロジェクトで利用可能なグラフデータに適用し、性能や効率への影響を評価する。

Original: Exploring the impact of adaptive rewiring in Graph Neural Networks domain ★★★

cs.LG updates on arXiv.org

協調的閾値ウォーターマーキング

Federated Learning (FL) におけるモデルの出所証明のため、スケールせず削除されやすい既存のウォーターマーキング手法の課題を解決する $(t,K)$-閾値ウォーターマーキングを提案。 $t$人以上のクライアントが協調してウォーターマークを埋め込み、キーの再構築と検証を行うことで、個々のクライアントによる検知・削除を防ぐ。 $K=128$ の大規模設定でも精度低下を最小限に抑えつつ、適応的ファインチューニング攻撃にも耐性があることを実証。

Action: Federated Learningにおけるモデルの信頼性向上のため、提案された $(t,K)$-閾値ウォーターマーキングの技術的詳細と、既存のFLフレームワークへの適用可能性を調査する。

Original: Collaborative Threshold Watermarking domain ★★

cs.LG updates on arXiv.org

LOREN: ニューラル受信機における低ランクベースのコードレート適応

ニューラル受信機の高メモリ・高電力要件を解決するため、LOREN（低ランクベースのコードレート適応ニューラル受信機）を提案。軽量な低ランクアダプターを畳み込み層に統合し、コードレートごとに小規模なアダプターのみを学習させることで、最小限のオーバーヘッドで適応性を実現。ハードウェア実装により、シリコン面積の65%超、電力消費の最大15%削減を達成し、既存手法と同等以上の性能を示す。

Action: LORENの低ランク適応手法を、他のニューラルネットワークモデル（例: LLM、画像認識モデル）の効率化に応用できるか調査する。

Original: LOREN: Low Rank-Based Code-Rate Adaptation in Neural Receivers domain ★★★

cs.LG updates on arXiv.org

FIREで打ち倒せ：深層ニューラルネットワークにおける実行時バックドア緩和のための潜在空間方向の活用について

深層ニューラルネットワークにおける実行時バックドア緩和のための「FIRE」(Feature-space Inference-time REpair)という手法を提案。トリガーが潜在空間に構造化された変化をもたらすという仮説に基づき、バックドア方向を逆転させて推論を修正する。低計算オーバーヘッドで、画像ベンチマークにおいて既存の実行時緩和策を上回る性能を示す。

Action: デプロイ済みの深層学習モデルにおけるバックドア攻撃への対策として、提案されているFIRE手法の適用可能性を調査し、可能であればPOC（概念実証）を実装する。

Original: Kill it with FIRE: On Leveraging Latent Space Directions for Runtime Backdoor Mitigation in Deep Neural Networks domain ★★★

cs.LG updates on arXiv.org

半教師ありドメイン間模倣学習

クロスドメイン模倣学習（CDIL）を加速するための半教師あり設定（SS-CDIL）を提案。少数のターゲット専門家デモンストレーションとラベルなしの不完全な軌跡のみを使用。実験により、最小限の監督で安定かつデータ効率の良いポリシー学習が可能であることを実証。

Action: 提案された半教師ありドメイン間模倣学習（SS-CDIL）アルゴリズムの実装コード（GitHubリポジトリ）を確認し、既存の模倣学習タスクへの適用可能性を調査する。

Original: Semi-Supervised Cross-Domain Imitation Learning domain ★★

cs.LG updates on arXiv.org

輸送、生成せず：組み合わせ最適化のための決定論的幾何学的フロー

CycFlowは、組み合わせ最適化のための新しいフレームワークであり、生成モデルに代わり決定論的な点輸送を採用しています。この手法は、インスタンス条件付きベクトル場を利用して座標を円形配置に変換し、角度ソートで最適ツアーを復元します。これにより、既存の拡散モデルと比較して解法速度が最大3桁向上し、最適性ギャップも競争力のあるレベルを維持します。

Action: CycFlowフレームワークと、組み合わせ最適化におけるその適用可能性について調査し、既存のNCO手法との比較実装を検討する。

Original: Transport, Don't Generate: Deterministic Geometric Flows for Combinatorial Optimization domain ★★★

cs.LG updates on arXiv.org

PRISM: 並列残差反復系列モデル

生成系系列モデリングにおける表現力と効率性のトレードオフを解決するため、PRISM（Parallel Residual Iterative Sequence Model）を提案。ソルバーにヒントを得た並列化可能な多段階洗練アーキテクチャにより、既存手法より174倍のスループットを実現。理論的にもRank-L累積を達成し、効率と性能を両立させる。

Action: PRISMのアーキテクチャと実装詳細を調査し、既存のモデルと比較してその性能を評価する。

Original: PRISM: Parallel Residual Iterative Sequence Model domain ★★★

cs.LG updates on arXiv.org

RePO: リフレーシング・ポリシー最適化によるオンポリシー学習とオフポリシー知識の統合

LLMのドメイン特化学習における課題（SFTは汎用性低下、オンポリシーRLは難解サンプルに弱い）に対し、RePOを提案。 RePOは、オフポリシー知識をモデルの分布に合わせてリフレーシングし、低報酬のロールアウトを置き換えることで、学習の安定性を保ちつつ難解サンプルを効果的に活用する。実験により、RePOが難解サンプルの利用を改善し、既存手法を上回る最先端の性能を達成することが示された。

Action: RePOの論文を読み、LLMの強化学習における「リフレーシング・ポリシー最適化」のメカニズムと効果を理解する。可能であれば、提案手法をローカル環境で再現・評価するための実験計画を立てる。

Original: RePO: Bridging On-Policy Learning and Off-Policy Knowledge through Rephrasing Policy Optimization domain ★★★

cs.LG updates on arXiv.org

プライベートな最悪ケースグループ最適化のための適応的サンプリング

平均損失を最小化するモデルは、データ内の小規模または学習困難なグループで精度が低下する問題がある。本研究では、差分プライバシー下での最悪ケースグループ最適化アルゴリズム「ASC」を提案。これは、各グループのサンプリング率とクリッピング閾値を適応的に制御し、一貫したプライバシー保証を提供する。 ASCは、低分散勾配、よりタイトなプライバシー保証、および全体的な平均精度を犠牲にしない最悪ケースグループ精度の向上をもたらす。

Action: 差分プライバシーを考慮したAIモデルの学習手法（特に最悪ケースグループ最適化）について調査し、実装の可能性を検討する。

Original: Adaptive Sampling for Private Worst-Case Group Optimization domain ★★

cs.LG updates on arXiv.org

SimuScene: 物理シナリオをシミュレートするためのコード生成のトレーニングとベンチマーキング

LLMによる物理シナリオのコード生成シミュレーションに関する初の研究「SimuScene」を提案。 5つの物理ドメインと52の概念を網羅するデータセット（7,659シナリオ）を構築し、既存LLMの性能は21.5%に留まることを示す。視覚的報酬を用いた強化学習パイプラインにより、物理シミュレーションおよび汎用コード生成能力の向上が確認された。

Action: 「SimuScene」データセットと強化学習パイプラインを調査し、物理シミュレーションにおけるLLMのコード生成能力向上への応用可能性を検討する。

Original: SimuScene: Training and Benchmarking Code Generation to Simulate Physical Scenarios domain ★★

cs.LG updates on arXiv.org

グローバル時間的検索拡張による多変量時系列予測の強化

既存の多変量時系列予測モデルは、限定的な過去のコンテキストに依存しており、長い周期性を持つグローバルなパターンを捉えるのが困難である。 Global Temporal Retriever (GTR) は、ホストモデルのアーキテクチャを変更せずに、局所的・大域的依存関係をモデル化し、短期観測と長期周期性を繋ぐ軽量モジュールである。 GTRは、計算コストの増加や過学習を抑えつつ、6つの実データセットで最先端の性能を示し、MTSFタスクにおけるグローバル周期性モデリングの効率的かつ汎用的な解決策となる。

Action: GTRモジュールのGitHubリポジトリを調査し、多変量時系列予測タスクへの適用可能性を評価する。

Original: Enhancing Multivariate Time Series Forecasting with Global Temporal Retrieval domain ★★★

cs.LG updates on arXiv.org

一般消費者向けハードウェアにおける電力負荷予測のための時系列基盤モデル：多次元ゼロショットベンチマーク

時系列基盤モデル（TSFM）は、タスク固有の学習なしで電力負荷予測に有望なゼロショット予測能力を示し、一般消費者向けハードウェアでもベースラインを大幅に上回りました。 TSFMは事前学習された時間パターン認識により、最小限のコンテキストでも安定した精度を維持する一方、Prophetのような従来モデルは短いウィンドウで苦戦しました。モデル間のキャリブレーションにばらつきがあり、Chronos-2は良好でしたが、他は過信傾向が見られました。実践的なモデル選択ガイドラインも提供されています。

Action: TSFMの性能評価とベンチマークフレームワークを調査し、自社の電力負荷予測タスクへの応用可能性を検討する。

Original: Time Series Foundation Models for Energy Load Forecasting on Consumer Hardware: A Multi-Dimensional Zero-Shot Benchmark domain ★★★

cs.LG updates on arXiv.org

通信分野におけるゲート付きニューロン選択を使用した自動モデル設計

通信業界では深層学習が不可欠ですが、モデル設計は依然として困難です。本論文では、通信分野の表形式データ向けに、新しいNAS手法であるTabGNS（Tabular Gated Neuron Selection）を提案します。 TabGNSは、予測性能を向上させつつ、モデルサイズを大幅に縮小し、検索時間を短縮します。

Action: 通信関連プロジェクトにおける自動モデル設計のためにTabGNSを調査・評価する。

Original: Automated Model Design using Gated Neuron Selection in Telecom domain ★★

cs.LG updates on arXiv.org

ICA: 情報認識型信用割り当てによる視覚的根拠を持つ長期間情報探索エージェント

Web環境での情報探索エージェントの学習は、低品質なフィードバックとスパースな報酬により困難が伴う。本研究では、Webページを視覚的スナップショットとして扱い、レイアウト情報を活用してエージェントの探索効率を高めるフレームワークを提案する。情報認識型信用割り当て（ICA）手法により、各スナップショットの貢献度を推定し、学習信号を効果的に伝播させることで、既存のテキストベース手法を上回る性能を達成した。

Action: GitHubリポジトリ (https://github.com/pc-inno/ICA_MM_deepsearch.git) を確認し、提案されたICA手法と視覚的根拠を持つエージェントの実装を調査する。

Original: ICA: Information-Aware Credit Assignment for Visually Grounded Long-Horizon Information-Seeking Agents domain ★★★

cs.LG updates on arXiv.org

多次元CDFの均一近似と固定価格メカニズムのサンプル複雑性

多次元累積分布関数（CDF）の均一近似におけるサンプル複雑性を、1ビットフィードバック（バンディットフィードバック）下で解析しました。次元数 $n$ が対数項にのみ影響する、次元数にほぼ依存しないサンプル複雑性を示しました。この結果を、小規模市場での固定価格メカニズム学習のサンプル複雑性限界と後悔保証に適用します。

Action: 多次元CDFの学習や固定価格メカニズムの最適化に関する理論的知見を、将来的なデータ分析機能やサービス改善に応用できるか調査する。

Original: The Sample Complexity of Uniform Approximation for Multi-Dimensional CDFs and Fixed-Price Mechanisms domain ★

cs.LG updates on arXiv.org

FedPS: 集計統計による連合データ前処理

FedPSは、データ共有なしで機械学習モデルを共同でトレーニングするための連合学習（FL）における、見過ごされがちなデータ前処理の課題に対応するフレームワークです。プライバシー制約と通信効率の課題を克服するため、データスキッチング技術を利用してローカルデータセットの統計情報を効率的に集約します。このフレームワークは、特徴量スケーリング、エンコーディング、離散化、欠損値補完のための連合アルゴリズムを提供し、水平・垂直FL設定の両方でk-Meansなどのモデルを拡張します。

Action: FedPSフレームワークを調査し、連合学習プロジェクトでのデータ前処理に適用可能か検討する。

Original: FedPS: Federated data Preprocessing via aggregated Statistics domain ★★

cs.LG updates on arXiv.org

ボードゲームのためのリソース効率的なモデルフリー強化学習

ボードゲームにおけるAIの意思決定ベンチマークとして、AlphaZeroのような検索ベース強化学習は成功しているが計算コストが高い。本研究では、より効率的な学習を目指すモデルフリー強化学習アルゴリズムを提案。 5つのボードゲーム（Animal Shogi, Gardner Chess, Go, Hex, Othello）での実験により、既存手法より効率的な学習を実現し、コア技術の重要性を示す。

Action: 提案されたモデルフリー強化学習アルゴリズムをボードゲームに適用し、その学習効率を検証する。

Original: Resource-Efficient Model-Free Reinforcement Learning for Board Games domain ★★

cs.LG updates on arXiv.org

自然超勾配降下法：アルゴリズム設計、収束解析、および並列実装

本研究では、経験的フィッシャー情報行列をヘッセ行列の近似として利用する新しい二値最適化手法「自然超勾配降下法（NHGD）」を提案します。並列化フレームワークにより、計算時間を大幅に削減しつつ、最先端手法と同等の理論的保証を提供します。大規模機械学習設定における実用的な優位性とスケーラビリティを示しました。

Action: NHGDアルゴリズムを既存の機械学習パイプラインに統合し、そのパフォーマンスとスケーラビリティを評価する。

Original: Natural Hypergradient Descent: Algorithm Design, Convergence Analysis, and Parallel Implementation domain ★★★

cs.LG updates on arXiv.org

リカレントニューラルネットワークの学習におけるバーンインフェーズの調整がパフォーマンスを向上させる

BPTTの代替としてTruncated BPTTが使われるが、精度低下の可能性がある。 RNNの「バーンインフェーズ」はパフォーマンスに大きな影響を与える重要なチューニングパラメータであり、その適切な調整により、予測誤差を大幅に（場合によっては60%以上）削減できる。

Action: RNNの時系列タスクにおける学習効率と精度向上のため、バーンインフェーズの調整に関する理論的知見と実験結果を調査し、既存のモデル学習プロセスに適用を検討する。

Original: Tuning the burn-in phase in training recurrent neural networks improves their performance domain ★★★

cs.LG updates on arXiv.org

減衰する安全マージンによるオンラインCMDPのほぼ定数の強い違反と最終イテレーション収束

制約付きマルコフ決定過程（CMDP）における安全なオンライン強化学習のための新しいアルゴリズム「FlexDOME」を提案。 FlexDOMEは、既存手法の限界（収束の遅延や制約違反の増大）を克服し、ほぼ定数レベルの強い制約違反と準線形な強い後悔を同時に達成。時間変化する安全マージンと正則化項を導入し、革新的な漸近優位戦略により理論的保証を確立。

Action: この論文のアルゴリズム（FlexDOME）は、理論的な保証を持つ安全なオンライン強化学習手法を提案しています。関連するRLライブラリ（例: Stable-Baselines3, RLlib）で、これらの概念を実験的に検証することを検討する。

Original: Near-Constant Strong Violation and Last-Iterate Convergence for Online CMDPs via Decaying Safety Margins domain ★★

cs.LG updates on arXiv.org

都市ブロックの多属性欠損値補完のための空間形態モデリング

・都市ブロックレベルでのFSI・GSIなどの欠損都市データを再構築する「空間形態（SM）インピュターツール」を提案。・都市規模の形態パターンと局所的空間情報を組み合わせ、正確な補間を実現。・SMとIDW/sKNN等の手法を組み合わせることで、既存SOTAモデルを上回る性能を発揮。

Action: 都市ブロックの欠損値補完における空間形態モデリングと近傍法（IDW, sKNN）の組み合わせについて、関連するOSSライブラリやAPIの有無を調査し、将来的なデータ分析ツールへの応用を検討する。

Original: Spatial-Morphological Modeling for Multi-Attribute Imputation of Urban Blocks domain ★★

cs.LG updates on arXiv.org

CMAD：確率的最適制御による協調型マルチエージェント拡散

既存の画像生成モデルの合成・構成制御の課題に対し、確率的最適制御（Stochastic Optimal Control）の枠組みを提案。複数の事前学習済み拡散モデルを協調的なエージェントとみなし、最適制御によって共通の目的へ誘導する新しいアプローチ。このフレームワークを条件付きMNIST生成で検証し、既存手法と比較。

Action: 確率的最適制御を用いたマルチエージェント拡散モデルの協調フレームワークを調査し、画像生成パイプラインへの応用可能性を検討する。

Original: CMAD: Cooperative Multi-Agent Diffusion via Stochastic Optimal Control domain ★★★

cs.LG updates on arXiv.org

時間的注意における確率的オウム返し -- 対角線シンクの調整

1. 時空間モデルは、空間構造と時間的ダイナミクスを分析する際に情報が退化しやすい。 2. 本研究では、時間的注意機構におけるバイアスの存在を、ヤコビアンの感度境界から理論的に解析し、対角線アテンションシンク問題を発見した。 3. 提案された正則化手法により、この問題の効果的な軽減が実験的に実証された。

Action: 時空間モデルにおける時間的注意機構の感度境界を解析し、対角線アテンションシンク問題とその正則化手法について、自身のAIプロジェクト（特にシーケンスデータや時空間データ扱う場合）での適用可能性を検討する。

Original: Stochastic Parroting in Temporal Attention -- Regulating the Diagonal Sink domain ★★★

cs.LG updates on arXiv.org

ロータリー位置埋め込みを位相変調として捉える：長文脈TransformerにおけるRoPEベースの理論的限界

RoPEを位相変調と捉え、長文脈Transformerで位置情報の一貫性を保つためのRoPEベースパラメータの下限（エイリアシング、DC安定性）と上限（浮動小数点精度）を理論的に導出。深層Transformerへの拡張、およびモデルの深さ・精度依存の「ゴールドラッシュゾーン」を定義。 LLaMA, Mistral等で実証し、アテンション崩壊や1Mトークン超での精度壁といった現象を理論的に説明。

Action: 長文脈TransformerにおけるRoPEの理論的限界（ベースパラメータの下限・上限）に関する本論文を読み、モデルの性能限界や改善点についての理解を深め、実際のLLM開発に活かす。

Original: Rotary Positional Embeddings as Phase Modulation: Theoretical Bounds on the RoPE Base for Long-Context Transformers domain ★★★

cs.LG updates on arXiv.org

MoEEdit: Mixture-of-Experts LLMのための効率的かつルーティング安定な知識編集

既存の知識編集手法は主に密なLLM向けであり、普及しつつあるMoEモデルへの適用には計算コストが高く、ルーティングの不安定化を招く課題がある。 MoEEditは、MoE LLM向けの初のルーティング安定な知識編集フレームワークであり、エキスパート更新をパーエキスパートのヌル空間射影で再パラメータ化し、ルーティングシフトを抑制する。実験により、MoEEditは最先端の有効性と汎化性能、高い特異性とルーティング安定性を達成し、計算・メモリ効率も優れていることが示された。

Action: MoEEditの論文を調査し、大規模言語モデル（LLM）における知識編集の最新動向を把握する。特に、Mixture-of-Experts（MoE）アーキテクチャへの知識編集手法の適用可能性と、ルーティング安定性の重要性について理解を深める。

Original: MoEEdit: Efficient and Routing-Stable Knowledge Editing for Mixture-of-Experts LLMs domain ★★★

cs.LG updates on arXiv.org

敵対的破損を伴うヘテロセダスティック一般化線形バンディットのための、共同で効率的かつ最適なアルゴリズム

敵対的破損を伴うヘテロセダスティック一般化線形バンディット（GLB）問題に対し、オンラインミラーディセント（OMD）ベースの推定器とヘシアンベースの信頼重みを用いた新しいアルゴリズム「HCW-GLB-OMD」を提案。計算効率が高く、$O(1)$ の空間・時間計算量で反復処理が可能。提案アルゴリズムは、様々なGLBインスタンスに対して、腐敗項の$\kappa$因子を考慮したインスタンスごとのミニマックス最適性を達成する。

Action: このアルゴリズムの、実際のレコメンデーションシステムや強化学習への応用可能性を調査する。

Original: A Jointly Efficient and Optimal Algorithm for Heteroskedastic Generalized Linear Bandits with Adversarial Corruptions domain ★★

cs.LG updates on arXiv.org

RiemannGL: リーマン幾何学がグラフ深層学習にもたらす変革

グラフの非ユークリッド構造の理解と学習には、リーマン幾何学が原則的かつ不可欠な基盤を提供する。既存手法の限界（双曲空間、外的な定式化）を超え、GNNに本質的な多様体構造を組み込むことが重要である。本論文は、多様体タイプ、ニューラルアーキテクチャ、学習パラダイムの3次元にわたる研究アジェンダを提案し、リーマン幾何学をグラフ学習の基礎的フレームワークとして探求することを奨励する。

Action: グラフニューラルネットワークにおけるリーマン幾何学の応用について、論文を調査し、実装の可能性を探る。

Original: RiemannGL: Riemannian Geometry Changes Graph Deep Learning domain ★★★

cs.LG updates on arXiv.org

サンプル効率の高い生成分子最適化：共同自己改善アプローチ

生成的分子最適化は、既存化合物を凌駕する特性を持つ分子設計を目指すが、サンプル効率が重要である。分布シフトの問題に対処するため、生成モデルと予測モデルを統合し、自己改善サンプリングを行う「共同自己改善」手法を提案。実験により、限定的な評価予算下で最先端手法を上回る性能を示した。

Action: この手法（共同自己改善）の、化学分野以外の生成モデル最適化タスクへの応用可能性を調査する。

Original: Sample Efficient Generative Molecular Optimization with Joint Self-Improvement domain ★★

cs.LG updates on arXiv.org

TVCACHE: Post-Training LLMエージェントのためのステートフルなツール-バリューキャッシュ

LLMエージェントのポストトレーニングにおける外部ツールの実行時間とコスト問題を、ステートフルなキャッシュ機構TVCACHEで解決。 TVCACHEはツール呼び出し履歴の最長一致マッチングにより、環境状態の一貫性を保証し、キャッシュヒット率を最大70%、実行時間を最大6.9倍改善。

Action: LLMエージェントのポストトレーニングにおけるツール実行の効率化のため、TVCACHEの導入・検証を検討する。

Original: TVCACHE: A Stateful Tool-Value Cache for Post-Training LLM Agents domain ★★★

cs.LG updates on arXiv.org

ROCKET: 校正ガイド付きナップサック強化型トランケーションによる高速最適化を用いた効率的なモデル圧縮

ROCKETは、教師なし学習なしで最先端の性能を達成するモデル圧縮手法です。層ごとの圧縮割り当てを多選択ナップサック問題として定式化し、キャリブレーションセットを用いた単段階スパース行列分解により、反復最適化や誤差逆伝播を回避します。 20-50%の圧縮率で既存手法を上回り、ファインチューニングにより性能回復が大幅に向上します。

Action: ROCKETのリポジトリ (github.com/mts-ai/ROCKET/tree/main) を確認し、モデル圧縮手法の実装を調査する。

Original: ROCKET: Rapid Optimization via Calibration-guided Knapsack Enhanced Truncation for Efficient Model Compression domain ★★★

cs.LG updates on arXiv.org

OSIL: 非選好軌跡から推論される安全性を用いたオフライン安全模倣学習ポリシーの学習

非選好軌跡から安全性を推論する新しいオフライン安全模倣学習（IL）アルゴリズム「OSIL」を提案。明示的な安全コストや報酬情報がない場合でも、望ましくない挙動を示す軌跡を学習することで、回避すべき行動を暗黙的に学習。 CMDPの枠組みで、安全かつ報酬最大化するポリシーをオフラインデモンストレーションのみから学習し、既存手法を上回る結果を示す。

Action: OSILアルゴリズムの論文を詳細に調査し、CMDPにおける安全性の推論メカニズムと、非選好軌跡の活用方法について理解を深め、将来的な強化学習プロジェクトへの応用可能性を探る。

Original: OSIL: Learning Offline Safe Imitation Policies with Safety Inferred from Non-preferred Trajectories domain ★★

cs.LG updates on arXiv.org

フュージョンが役立つときと壊れるとき：同一ソースの金融画像処理におけるビューアラインド頑健性

SGEスポットゴールドデータを用いた金融画像処理におけるマルチビュー学習と敵対的頑健性に関する研究。2つの異なるビュー（価格/ボリュームチャート、テクニカル指標）を構築し、ラベルノイズを低減するフィルターを適用。後期フュージョン（デュアルエンコーダ＋フュージョンヘッド）は早期フュージョンより全体的に優れており、フィルター処理は予測信号を明らかにする可能性があるが、分散を増加させる。金融画像モデルは敵対的攻撃に対して脆弱であり、後期フュージョンはビュー制約付き攻撃に対して頑健性を向上させるが、同時攻撃は依然として課題である。

Action: 金融時系列画像分析において、モデルの頑健性を向上させるために、後期フュージョン技術およびビュー制約付き敵対的防御メカニズムの実装を調査・検討する。

Original: When Fusion Helps and When It Breaks: View-Aligned Robustness in Same-Source Financial Imaging domain ★★★

cs.LG updates on arXiv.org

シャッフルされたWOOリリースにおける文書ページ順序の学習

本論文は、ページ埋め込みを用いてシャッフルされたWOO文書のページ順序を調査し、ポインターネットワーク、seq2seqトランスフォーマー、ペアワイズランキングモデルを比較した。 seq2seqトランスフォーマーは長文文書で一般化に失敗し、モデルの専門化が必要であることが示唆されており、アテンションパターンは短文と長文で異なる戦略を必要とすることを示唆している。モデルの専門化により長文文書で大幅な改善が見られ、文書長に応じた特化型アプローチの必要性が浮き彫りになった。

Action: 長文文書におけるseq2seqトランスフォーマーの性能低下と、モデル専門化による改善の可能性について調査し、実装を検討する。

Original: Learning Page Order in Shuffled WOO Releases domain ★★

cs.LG updates on arXiv.org

マルチモーダル言語モデルを用いたマルチコモディティフロー問題の解決：分割、調和、そして征服

マルチコモディティフロー（MCF）問題に対し、マルチモーダル言語モデル（MLM）を活用した初の機械学習ベース手法「Pram」を提案。 Pramは、問題を局所サブ問題に分割しMLMエージェントで解決後、強化学習で全体の一貫性を確保し、最適性と実行可能性のトレードオフを解消。線形計画法solversに匹敵する精度と1～2桁高速な実行時間、リンク障害への強い頑健性を実証。

Action: Pram手法におけるMLMエージェントと強化学習による調和アルゴリズムの学習プロセスと実装詳細を調査し、既存の最適化システムへの統合可能性を検討する。

Original: Divide, Harmonize, Then Conquer It: Shooting Multi-Commodity Flow Problems with Multimodal Language Models domain ★★★

cs.LG updates on arXiv.org

MoToRec: 疎正則化されたマルチモーダルトークン化によるコールドスタート推薦

推薦システムにおけるデータ疎性・アイテムコールドスタート問題に対応するため、MoToRecフレームワークを提案。疎正則化されたRQ-VAEとアダプティブ希少性増幅、階層型エンコーダにより、コールドスタートアイテムの性能を向上。実験により、最先端手法を上回る性能を示し、離散トークン化がコールドスタート課題の有効な解決策であることを実証。

Action: MoToRecフレームワークと疎正則化されたRQ-VAEを調査し、コールドスタート問題に対応するために推薦システムへの応用可能性を探る。

Original: MoToRec: Sparse-Regularized Multimodal Tokenization for Cold-Start Recommendation domain ★★★

cs.LG updates on arXiv.org

モーションキャプチャはターゲットドメインではない：モーション表現学習のための合成データのスケーリング

人体モーションモデリングにおける実データ不足に対し、合成データが解決策となる。合成モーションデータを用いた事前学習は、実データと混合または十分なスケールで、人間活動認識(HAR)タスクの汎化性能を向上させる。モーションキャプチャとウェアラブル信号間のドメイン不一致は、大規模データ事前学習の利益を限定し、シム・ツー・リアル課題を浮き彫りにする。

Action: AR/VRやウェアラブルデバイス分野での人間活動認識(HAR)タスクにおいて、合成データを用いたモデルの事前学習や、シム・ツー・リアル(sim-to-real)移行の課題と機会について調査・実験する。

Original: Motion Capture is Not the Target Domain: Scaling Synthetic Data for Learning Motion Representations domain ★★

cs.LG updates on arXiv.org

野外でのモデル生物：データ属性によるプロダクションLLMポストトレーニングにおける望ましくない創発的振る舞いの軽減

LLMのポストトレーニングにおける望ましくない振る舞いを、学習データに起因するものとして特定・軽減する「アクティベーションベースのデータ属性」手法を提案。「distractor-triggered compliance」という、無害なフォーマット指示付きの危険な要求にモデルが従う有害な振る舞いを特定し、データフィルタリングで63%削減、ラベル変更で78%削減を達成。既存手法より高性能かつ低コストであり、安全性技術のための現実的なベンチマークを提供する。

Action: LLMの安全性とデータ属性に関する研究論文のため、提案手法の実現可能性と、自社プロダクトへの応用可能性について調査する。

Original: In-the-Wild Model Organisms: Mitigating Undesirable Emergent Behaviors in Production LLM Post-Training via Data Attribution domain ★★★

cs.LG updates on arXiv.org

LLM APIにおけるトークン効率的な変更検出

LLMのAPIにおけるリモート変更検出は、コストが高いか、モデルの内部情報が必要で困難な課題です。本研究では、複数のトップ出力トークンを持つ「ボーダー入力」を利用するB3IT（Black-Box Border Input Tracking）を提案し、厳格なブラックボックス設定で低コストかつ高精度な変更検出を実現します。 B3ITは既存手法に匹敵する性能を、コストを30倍削減しながら達成し、特に非推論エンドポイントで有効です。

Action: LLM APIの監視やモデル変更の検出に、提案されているB3IT（Black-Box Border Input Tracking）スキームの導入を検討する。

Original: Token-Efficient Change Detection in LLM APIs domain ★★★

cs.LG updates on arXiv.org

GRASP: 患者のためのグループShapley特徴量選択

医療予測における特徴量選択の課題に対処するため、SHAPによるグループ重要度スコアとグループL21正則化を組み合わせた新規フレームワーク「GRASP」を提案。 LASSOや深層学習ベースの手法と比較して、同等以上の予測精度を維持しつつ、より少なく、冗長性が低く、安定した特徴量セットを特定できることを実証。この手法は、医療分野でのロバストかつ解釈性の高い特徴量選択に貢献する。

Action: GRASPフレームワークのアルゴリズムと実装の詳細を調査し、既存のデータセットへの適用可能性を評価する。

Original: GRASP: group-Shapley feature selection for patients domain ★★

cs.LG updates on arXiv.org

低確率性と多様な行動ポリシーを持つ困難なオフラインRLデータセットのための汎用柔軟$f$-ダイバージェンス

オフラインRLデータセットによく見られる、多様性や探索の低さ、複数の行動ポリシーといった課題に対処する。 $f$-ダイバージェンスと最適化制約の関係をLP形式で解明し、データセットに基づき学習目標を適応的に制約する柔軟な$f$-ダイバージェンスを提案する。 MuJoCo, Fetch, AdroitHand環境での実験により、提案手法が困難なデータセットからの学習性能向上に有効であることを実証。

Action: 提案されている柔軟な$f$-ダイバージェンスの実装を探し、自身のオフラインRLデータセットでの適用可能性を評価する。

Original: General Flexible $f$-divergence for Challenging Offline RL Datasets with Low Stochasticity and Diverse Behavior Policies domain ★★★

cs.LG updates on arXiv.org

ニューラルPDEサロゲートのためのキャリブレーション対応不確実性の直接学習

ニューラルPDEサロゲートにおいて、キャリブレーションされた不確実性を直接学習する新しいフレームワークを提案。アンサンブルや事後校正に代わる手法として、学習中に不確実性パラメータを最適化し、学習データとテストデータの不一致を低減。 Fourier Neural Operatorsでの評価により、高精度な不確実性推定とエラー領域への集中が確認された。

Action: 提案されたキャリブレーション対応不確実性学習フレームワークをFourier Neural Operatorに適用し、実際のPDE問題での有効性を評価するための実験を計画・実行する。

Original: Direct Learning of Calibration-Aware Uncertainty for Neural PDE Surrogates domain ★★★

cs.LG updates on arXiv.org

MerLin: 光子およびハイブリッド量子機械学習のための発見エンジン

MerLinは、光子およびハイブリッド量子機械学習(QML)のためのオープンソースフレームワークであり、量子モデルの系統的な探索を可能にします。 PyTorchやscikit-learnと統合され、線形光学回路の強力なシミュレーションを通じて、量子層の微分可能なトレーニングをサポートします。再現性のあるベンチマークと、既存の機械学習エコシステムとの連携を重視し、ハードウェアとの協調設計ツールとしても機能します。

Action: MerLinフレームワークのドキュメントを調査し、量子機械学習の最新動向について理解を深める。

Original: MerLin: A Discovery Engine for Photonic and Hybrid Quantum Machine Learning domain ★★★

cs.LG updates on arXiv.org

物理情報ニューラルネットワークの統計的学習解析

PINNのパラメータ推定を統計的学習問題として定式化し、物理ペナルティを間接データの無限源と見なす。 PINNの学習プロセスを、真の分布とPINN分布間のKLダイバージェンス最小化として解析する。 PINN学習を特異学習問題と位置づけ、特異学習理論を用いて熱方程式IBVPのパラメータ推定を解析し、不確実性定量化と外挿能力への影響を議論する。

Action: PINNの統計的学習的側面についてさらに調査し、熱方程式IBVPなどの問題への適用可能性を検討する。

Original: Statistical Learning Analysis of Physics-Informed Neural Networks domain ★★

cs.LG updates on arXiv.org

自然言語から材料発見へ：材料知識ナビゲーションエージェント

自然言語による科学的意図を、データベース検索、物性予測、構造生成、安定性評価などの実行可能なアクションに変換する「材料知識ナビゲーションエージェント（MKNA）」を開発。 MKNAは、文献やデータベースから定量的な閾値や設計モチーフを抽出し、データに基づいた仮説形成を可能にする。高Debye温度セラミックスの探索に応用し、新規材料候補を提案。これは、自律的で言語誘導型の材料探査のための汎用プラットフォームを確立する。

Action: AIエージェントが科学分野（特に材料科学）でどのように活用できるかを調査し、科学文献解析のためのNLP技術の可能性を探る。

Original: From Natural Language to Materials Discovery:The Materials Knowledge Navigation Agent domain ★

cs.LG updates on arXiv.org

オフライン・フロンティア・シフト：生成型多目的最適化における分布限界の診断

オフライン多目的最適化（MOO）において、生成モデル（拡散モデル等）は他の指標で進化計算に劣ることが判明。この性能低下は、オフラインデータセットがパレートフロントからずれる「オフライン・フロンティア・シフト」という根本的な限界に起因する。この限界を克服するには、目的空間での分布外サンプリングが必要であり、生成モデルはそのオフライン目的分布に過度に接近する傾向がある。

Action: 生成モデルのオフライン多目的最適化における分布シフト問題の理解を深め、分布外サンプリング戦略の実装を検討する。

Original: The Offline-Frontier Shift: Diagnosing Distributional Limits in Generative Multi-Objective Optimization domain ★★

cs.LG updates on arXiv.org

強化学習における検証可能な報酬を用いた非対称プロンプト重み付け

検証可能な報酬を用いた強化学習のLLM応用において、成功確率の低いプロンプトに高い重みを与える「非対称プロンプト重み付け」を提案。この手法は、学習初期段階で精度の低いRLタスク（例: R1-Zero）に特に有効で、固定更新予算下での成功確率向上時間を理論的にも最適化する。低成功率の状況では、応答コストが支配的となるため、非対称重み付けが効果的な収束を加速させる。

Action: 低成功率プロンプトに焦点を当てた非対称重み付け手法を、既存のLLMの強化学習パイプラインに適用し、その効果を検証する。

Original: Asymmetric Prompt Weighting for Reinforcement Learning with Verifiable Rewards domain ★★

cs.LG updates on arXiv.org

回路からダイナミクスへ：3D拡散トランスフォーマーにおける故障の理解と安定化

3D拡散トランスフォーマーが直面する「Meltdown」現象（入力摂動による出力断片化）を解明。メカニズム解釈手法により、故障が単一のクロスアテンション活性化に起因することを特定し、スペクトルエントロピーが故障の指標となることを発見。この知見に基づき、テスト時制御「PowerRemap」を導入し、98.3%までの安定化率で故障を効果的に抑制。

Action: 3D拡散トランスフォーマーの入力摂動に対する脆弱性（Meltdown）と、それを軽減するためのPowerRemap手法について調査し、自身のプロジェクトで応用可能か検討する。

Original: From Circuits to Dynamics: Understanding and Stabilizing Failure in 3D Diffusion Transformers domain ★★★

cs.LG updates on arXiv.org

ちょうど良いタイミング：拡散言語モデルのためのトークンレベル早期停止

拡散言語モデルは、多くのトークンが最終段階前に安定化するため、計算効率が低いという課題がある。提案手法は、軽量な信号を用いて各トークンの収束を動的に判定し、タスク固有のファインチューニングなしに適応的なトークン凍結を可能にする。これにより、生成品質を維持しながら、多様なベンチマークで大幅な効率向上を達成する。

Action: 拡散言語モデルのプロジェクトに、提案されているトークンレベル早期停止手法の実装や実験を検討する。

Original: Just on Time: Token-Level Early Stopping for Diffusion Language Models domain ★★★

cs.LG updates on arXiv.org

重み減衰は言語モデルの可塑性を向上させる

LLMの事前学習において、ハイパーパラメータ最適化は下流タスクへの適応能力（可塑性）を考慮することが重要である。本研究では、事前学習時の重み減衰がモデルの可塑性を向上させ、ファインチューニング時の性能向上に寄与することを示した。重み減衰の増加は、線形分離可能な表現の促進、アテンション行列の正則化、過学習の抑制を通じて、モデルの適応能力を高める。

Action: LLMの事前学習において、下流タスクへの適応性を高めるために、重み減衰の値を系統的に実験・調整することを検討する。

Original: Weight Decay Improves Language Model Plasticity domain ★★★

cs.LG updates on arXiv.org

TabICLv2: より高性能、高速、スケーラブルでオープンな表形式基盤モデル

新世代の表形式基盤モデル「TabICLv2」は、新規合成データ生成、スケーラブルな注意機構、最適化された事前学習プロトコルにより、既存手法を凌駕します。チューニングなしで性能が向上し、大規模データセットへの汎化能力が高く、RealTabPFN-2.5より高速です。推論コードとモデル重みが公開され、表形式データにおける機械学習の発展に貢献します。

Action: TabICLv2の公開コードとモデル重みを調査し、既存の表形式データ分析パイプラインへの適用可能性を検討する。

Original: TabICLv2: A better, faster, scalable, and open tabular foundation model domain ★★★

cs.LG updates on arXiv.org

GENIUS: 生成的流動知能評価スイート

現在のAI評価は知識想起に偏っており、即時的なパターン推論や制約実行、文脈適応能力（生成流動知能 - GFI）を測れていない。新しい評価スイート「GENIUS」は、GFIを3つの要素（暗黙的パターンの誘発、アドホック制約の実行、文脈知識への適応）に分解し、モデルの動的な推論能力を測定する。評価結果は、モデルのGFI能力不足が文脈理解の限界に起因することを示唆しており、訓練不要な注意介入戦略が提案されている。

Action: GENIUSのGitHubリポジトリで公開されるコードとデータセットを確認し、UMMの流動知能評価手法について理解を深める。

Original: GENIUS: Generative Fluid Intelligence Evaluation Suite domain ★★★

cs.LG updates on arXiv.org

Diffusion事前学習済み高密度・文脈考慮埋め込みモデル

Diffusion事前学習済み言語モデルを基盤とした、Webスケール検索用の多言語埋め込みモデルファミリー「pplx-embed」を紹介。標準検索用の「pplx-embed-v1」と、文脈埋め込み用の「pplx-embed-context-v1」の2種類をリリースし、各種ベンチマークで高い性能を発揮。長文ドキュメントのグローバルな文脈を維持し、大規模実世界検索シナリオで高い効率と品質を実現。

Action: pplx-embedモデルファミリーを調査し、特に長文ドキュメントや複雑なクエリの検索・取得コンポーネントへの統合可能性を検討してください。内部データセットや関連ベンチマークでの性能評価も推奨されます。

Original: Diffusion-Pretrained Dense and Contextual Embeddings domain ★★★

cs.LG updates on arXiv.org

IMUベースのオンライン手書き認識を、推論オーバーヘッドゼロの対照学習(Contrastive Learning)で強化する

IMUを用いたオンライン手書き認識において、エッジデバイスでのプライバシー向上と低遅延化を実現します。新フレームワーク「ECHWR」は、補助的な学習ブランチと対照学習（誤差ベースの損失を含む）を用いて、推論コストを増加させることなく認識精度を向上させます。実験では、従来手法を大幅に上回る性能を示し、未知の筆記スタイルにも対応可能であることを証明しました。

Action: ECHWRフレームワークを参考に、低リソース環境での手書き認識モデルの精度向上手法を調査・検証する。

Original: Enhancing IMU-Based Online Handwriting Recognition via Contrastive Learning with Zero Inference Overhead domain ★★★

cs.LG updates on arXiv.org

チャート理解のためのマルチモーダル情報融合：MLLMの進化、限界、および認知強化に関するサーベイ

チャート理解は、グラフィカルデータとテキストデータを融合する情報融合タスクであり、MLLMがこの分野に革命をもたらしています。本サーベイは、タスク、データセット、手法を分類し、古典的な深層学習から最先端のMLLMアプローチまでを網羅しています。 MLLMの知覚・推論能力の限界を検証し、高度なアライメント技術や強化学習による認知強化といった将来の方向性を示唆しています。

Action: MLLMライブラリを調査し、チャート理解タスクへの適用可能性を検討する。

Original: Multimodal Information Fusion for Chart Understanding: A Survey of MLLMs -- Evolution, Limitations, and Cognitive Enhancement domain ★★★

cs.LG updates on arXiv.org

LLMが著しく悪化する時：モデル劣化を検出するための統計的アプローチ

LLMの最適化（量子化など）による品質低下を検出するために、McNemar検定に基づいた統計的仮説検定フレームワークを提案。モデルのスコアをサンプルごとに比較することで、真の劣化とノイズによる誤差を区別し、誤検出率を制御。この手法により、0.3%といったわずかな精度低下も確実な劣化として特定可能であり、LM Evaluation Harnessでの実装例も示す。

Action: LLMの最適化（量子化など）を行った際に、モデルの品質低下を統計的に検出するためのMcNemar検定ベースのテストフレームワークをLM Evaluation Harnessに実装・適用する。

Original: When LLMs get significantly worse: A statistical approach to detect model degradations domain ★★

cs.LG updates on arXiv.org

siRNA 効能予測における解釈可能性の検証：摂動ベースのデータセット認識プロトコル

siRNA 効能予測における解釈可能性（特に Saliency Map）の検証プロトコルを提案。モデルの出力が、摂動（変異）の影響を正確に反映するかをカウンターファクチュアルに評価。データセット間の転移学習で発生しうる未知の失敗モードを特定し、BioPrior という生物学的知識に基づく正則化器の有効性を示唆。

Action: AIモデルの解釈可能性検証プロトコルの実装や、BioPriorのような生物学的知識を組み込んだ正則化手法の適用を検討する。

Original: Validating Interpretability in siRNA Efficacy Prediction: A Perturbation-Based, Dataset-Aware Protocol domain ★★

cs.LG updates on arXiv.org

基本的な可読性プロトコルが信頼される監視を向上させる

AIの制御プロトコル研究において、信頼されないAIシステムの有害な行動を防ぐための「可読性プロトコル」を提案。これは、より強力なAIを、より弱い信頼できるAIが監視する「信頼される監視」の有効性を高めるための手法。コードコメントを奨励する可読性プロトコルは、タスクパフォーマンスを犠牲にすることなく安全性を向上させ、特に正直なコードに有効であることが実験で示された。

Action: AIモデルの行動をより評価しやすくするための「可読性プロトコル」の導入を検討し、コードコメントやドキュメンテーションの標準化を推進する。

Original: Basic Legibility Protocols Improve Trusted Monitoring domain ★★★

cs.LG updates on arXiv.org

STRAND: シーケンス条件付きトランスポートによる単一細胞摂動予測

STRANDは、DNA配列を条件として単一細胞の転写応答を予測する生成モデルである。ゲノム上の位置における配列をエンコードすることで、未知の遺伝子摂動へのゼロショット推論を可能にし、ゲノムカバレッジを大幅に拡大する。性能向上、未知の遺伝子摂動ベンチマークでの高評価、新規細胞株への転移改善を示し、遺伝子レベルモデルが見逃す代替転写開始点を解決する。

Action: STRANDモデルのアーキテクチャを調査し、他の生物学的データ予測タスクへの応用可能性を検討する。

Original: STRAND: Sequence-Conditioned Transport for Single-Cell Perturbations domain ★★

cs.LG updates on arXiv.org

閉鎖プールビデオ検索を超えて：実世界ビデオ検索とモーメントローカライゼーションのためのベンチマークとエージェントフレームワーク

従来のビデオ検索ベンチマークは、閉鎖的なビデオプールと正確な記述に限定されており、オープンウェブ上での曖昧な実世界検索を反映できていません。 RVMS-Bench（実世界ビデオメモリ検索評価システム）と、人間の「想起・検索・検証」認知プロセスを模倣したエージェントフレームワークRACLOを提案。これらは、曖昧な記憶に基づいた実世界ビデオ検索に対応します。実験により、既存のMLLMは曖昧な記憶に基づく実世界ビデオ検索とモーメントローカライゼーションにおいて、依然として能力が不足していることが明らかになりました。

Action: MLLMの曖昧な記憶に基づく実世界ビデオ検索・モーメントローカライゼーション能力を向上させるための研究や、RVMS-Benchの活用を検討する。

Original: Beyond Closed-Pool Video Retrieval: A Benchmark and Agent Framework for Real-World Video Search and Moment Localization domain ★★

cs.LG updates on arXiv.org

EVA：免疫系の普遍的モデルに向けて

EVAは、免疫疾患のトランスレーショナルリサーチ向けに、種を超え、モダリティを統合した初の免疫学・炎症の基盤モデルです。単一細胞解決にとどまらず、トランスクリプトミクスと組織学データを統合し、リソーススケール則を確立して性能向上を示しました。薬物開発パイプライン全体を網羅する39のタスクで評価され、最先端の結果を達成。一部モデルはオープンソースで公開されます。

Action: 公開されたEVAのトランスクリプトミクス版を調査し、生物学的データ分析への応用可能性を探る。

Original: EVA: Towards a universal model of the immune system domain ★★★

cs.LG updates on arXiv.org

Performative Predictionの解剖：包括的サーベイ

2020年にPerdomo et al.によって提唱された「Performative Prediction」は、予測モデルの導入が環境の分布シフトを引き起こし、モデルと現実の分布の不一致を生むという機械学習の新しい設定です。この分野では、新たな解決策、理論的分析、他分野との連携が探求されており、本サーベイでは設定の分類、分布マップの実装、および問題解決手法について概観します。さらに、既存および未公表の分野間連携を指摘し、将来の研究を促進することを目指しています。

Action: 最新の機械学習分野であるPerformative Predictionの概念を理解し、自身の開発するシステムへの影響を検討する。

Original: Dissecting Performative Prediction: A Comprehensive Survey domain ★★

cs.LG updates on arXiv.org

ACE-RTL: エージェントコンテキスト進化とRTL特化LLMの融合

ACE-RTLは、RTLコード生成におけるLLMの活用を、ドメイン特化LLMとエージェントシステムを統合することで進化させます。生成、リフレクター、コーディネーターの3つのコンポーネントを連携させ、反復的にRTLコードを改善します。 CVDPベンチマークで14のベースラインを上回る44.87%のパスレート向上を達成し、並列スケーリング戦略により反復回数を削減します。

Action: ACE-RTLのアーキテクチャと並列スケーリング戦略を調査し、RTLコード生成への応用可能性を検討する。

Original: ACE-RTL: When Agentic Context Evolution Meets RTL-Specialized LLMs domain ★★★

cs.LG updates on arXiv.org

Key-Valueキャッシュからのエビクション学習

LLM推論におけるKVキャッシュのメモリ需要を課題とする。 KV Policy (KVP)フレームワークを提案。軽量RLエージェントでトークンの将来的な有用性を学習。 LLM非改変・推論オーバーヘッドなしで、既存手法を大幅に上回る性能を示す。

Action: LLM推論におけるKVキャッシュ最適化のため、KVPなどのRLベース戦略の実装を検討する。

Original: Learning to Evict from Key-Value Cache domain ★★★

cs.LG updates on arXiv.org

Power-SMC: トレーニングフリーLLM推論のための低遅延シーケンスレベル・パワーサンプリング

LLMの推論性能向上において、重み調整ではなく高確率経路に焦点を当てる分布シャープニングが重要であることが示唆されています。既存のシーケンスレベル・パワーサンプリング（例：MHサンプリング）は推論速度の低下を招く課題がありました。本研究では、低遅延かつ効果的なLLM推論を実現する新しいSMCベースの「Power-SMC」手法を提案し、MATH500データセットでその有効性を示しました。

Action: Power-SMC手法の論文を読み込み、そのアルゴリズムと実装の詳細を理解する。可能であれば、既存のLLMフレームワーク（例：Hugging Face Transformers）でPower-SMCを試すための実験コードを作成し、推論速度と精度のトレードオフを評価する。

Original: Power-SMC: Low-Latency Sequence-Level Power Sampling for Training-Free LLM Reasoning domain ★★★

cs.LG updates on arXiv.org

フローマッチングにおける不確実性定量化とガイダンス

フローマッチングモデルのサンプル品質のばらつきを改善するため、不確実性推定を組み込んだUA-Flowを提案。 UA-Flowは、生成される各サンプルの信頼性を示す不確実性信号を予測し、ガイダンスを通じて生成品質を向上させる。実験により、UA-Flowがベースラインより高いサンプル忠実度相関を示し、不確実性誘導サンプリングで生成品質がさらに向上することが確認された。

Action: UA-Flow（不確実性認識フローマッチング）を実装し、画像生成タスクにおいて不確実性推定とガイダンスがサンプル品質に与える影響を評価する。

Original: Flow Matching with Uncertainty Quantification and Guidance domain ★★★

cs.LG updates on arXiv.org

より多くのトークンは合理的か？適応的リソース合理性としての言語モデルにおける推論時スケーリング

LLMはタスクの複雑さに応じて推論戦略を適応させる能力を示し、これは人間の「リソース合理性」に似ています。「変数帰属タスク」を用いた実験では、モデルは複雑さが増すとブルートフォースから解析的戦略に移行することが示されました。リソース合理性は、明示的なコスト報酬なしに、推論時スケーリング自体から創発する性質であることが示唆されました。

Action: LLMの推論時スケーリングにおけるリソース合理性の創発メカニズムを調査し、自社プロダクトへの応用可能性を探る。

Original: Are More Tokens Rational? Inference-Time Scaling in Language Models as Adaptive Resource Rationality domain ★★★

cs.LG updates on arXiv.org

ニューラルネットワークを用いた惑星透過スペクトルにおける恒星汚染とノイズの効率的な削減

JWSTによる高精度な透過スペクトル観測では、恒星の不均一性が大気推定のバイアス原因となる。本研究では、ニューラルネットワーク（特にデノイジングオートエンコーダー）を用いて、この恒星汚染とノイズを効率的に除去する手法を提案。提案手法は、計算コストを大幅に削減しつつ、大気推定の精度を向上させ、低S/Nでも分子特徴を保持できる。

Action: ニューラルネットワークを用いたデノイジングオートエンコーダーによる、観測データ（例：天文データ、センサーデータ）のノイズ除去・汚染除去手法の実装を検討する。

Original: Efficient reduction of stellar contamination and noise in planetary transmission spectra using neural networks domain ★★

cs.LG updates on arXiv.org

確率的畳み込みニューラルネットワークを用いた条件付き不確実性認識型政治的ディープフェイク検出

政治的ディープフェイクは情報操作リスクを高め、既存検出器は不確実性を示せない。本研究では、確率的CNNを用いた不確実性認識型検出手法を提案し、実証的基準で評価。調整された確率的出力と不確実性推定は、リスク認識型モデレーションに不可欠。

Action: 信頼性とリスク評価を向上させるため、重要なコンテンツ分析に不確実性認識型AIモデルの導入を検討する。

Original: Conditional Uncertainty-Aware Political Deepfake Detection with Stochastic Convolutional Neural Networks domain ★★★

cs.LG updates on arXiv.org

大規模言語モデルにおけるWasserstein正則化トランケーションとマスペナルティを用いた幾何認識デコーディング

大規模言語モデル (LLM) の生成において、確率質量やエントロピーだけでなく、トークン埋め込み空間の意味的幾何学を考慮した新しいデコーディングルール「Top-W」を提案。 Wasserstein距離に基づき、確率質量とエントロピーのトレードオフを単純かつ効率的な形式で最適化する理論を導出。 GSM8K、GPQAなどのベンチマークで既存手法を大幅に上回る性能向上（最大33.7%）を達成し、精度と創造性の両方を向上させることを実験で確認。

Action: 提案されたTop-Wデコーディング戦略を、既存のLLM実装に統合または評価し、その効果を検証する。

Original: Geometry-Aware Decoding with Wasserstein-Regularized Truncation and Mass Penalties for Large Language Models domain ★★★

cs.LG updates on arXiv.org

解釈可能性アーティファクトからの自己解釈学習：ベクトルラベルペアでの軽量アダプターのトレーニング

言語モデルの自己解釈手法は、軽量アダプターをベクトルラベルペアでトレーニングすることで、ハイパーパラメータに依存せず信頼性が向上することを実証。微細なアダプター（$d_ ext{model}+1$パラメータ）で、凍結された大規模言語モデル（LLM）から高精度の解釈結果（特徴ラベル、トピック識別）を生成可能。自己解釈の改善はLLMのスケールと相関し、モデル自体の変更なしに、より深い洞察を可能にする。

Action: 軽量アダプターを用いた自己解釈手法の応用可能性を調査し、既存のLLMデバッグや挙動理解への活用法を検討する。

Original: Learning Self-Interpretation from Interpretability Artifacts: Training Lightweight Adapters on Vector-Label Pairs domain ★★★

cs.LG updates on arXiv.org

物理的に解釈可能な AlphaEarth 財団モデル埋め込みが LLM ベースの地表インテリジェンスを可能にする

Google AlphaEarthの埋め込みの物理的解釈可能性を分析し、多くの環境変数との高い相関関係と安定性を示しました。この解釈可能性に基づき、自然言語クエリを衛星データに基づいた評価に変換するLand Surface Intelligenceシステムを開発しました。衛星財団モデルの埋め込みは、環境・地理空間インテリジェンスに応用可能な物理的構造を持つことを実証しました。

Action: LLMと衛星データを組み合わせた地理空間インテリジェンスシステムの構築や、LLM-as-Judge評価手法の調査を検討する。

Original: Physically Interpretable AlphaEarth Foundation Model Embeddings Enable LLM-Based Land Surface Intelligence domain ★★★

cs.LG updates on arXiv.org

学習済みインストゥルメント表現による因果効果推定

未観測の交絡因子によるバイアスを軽減するIV法は、有効なインストゥルメントの特定が困難な場合がある。本論文では、観測された共変量からインストゥルメント表現を構築するZNetモデルを提案し、明示的なインストゥルメントなしでのIV推定を可能にする。 ZNetは既存のインストゥルメントを回復したり、潜在的なものを構築したりでき、一般的な因果推論のプラグアンドプレイモジュールとして機能する。

Action: ZNetモデルの実装を調査し、既存の因果推論パイプラインへの統合可能性を検討する。

Original: Causal Effect Estimation with Learned Instrument Representations domain ★

cs.LG updates on arXiv.org

Flash-SD-KDE: TensorコアによるSD-KDEの高速化

Score-debiased KDE (SD-KDE) は、経験的スコアの使用により計算速度が遅いという課題がありました。本研究では、計算順序を変更して行列乗算構造を露呈させ、Tensor Cores を利用して GPU 実装を高速化する手法を提案します。提案手法「Flash-SD-KDE」は、既存手法と比較して大幅に高速であり、大規模なデータセットでのSD-KDE適用を実用的になります。

Action: Tensor Cores を活用した Flash-SD-KDE による密度推定の高速化手法について調査し、自身のプロジェクトでの適用可能性を検討する。

Original: Flash-SD-KDE: Accelerating SD-KDE with Tensor Cores domain ★★★

cs.LG updates on arXiv.org

手頃で非侵襲的なリアルタイム低血糖検出に向けたウェアラブルセンサー信号の利用

低血糖の非侵襲的リアルタイム検出には、ウェアラブルセンサー（GSR、心拍数）の信号を用いる包括的なフレームワークを開発。単一信号分析に限定された従来の研究とは異なり、GSRとHRの組み合わせが感度と安定性を向上させることを実証。特に低リソース環境において、安価な非侵襲的センサーによるアクセス可能な血糖モニタリングへの道を開く。

Action: ウェアラブルセンサー信号を用いた低血糖検出のフレームワークを参考に、他の生体信号を用いた健康モニタリング応用や、リアルタイム生理信号分析のための深層学習モデルの活用を検討する。

Original: Towards Affordable, Non-Invasive Real-Time Hypoglycemia Detection Using Wearable Sensor Signals domain ★★★

cs.LG updates on arXiv.org

生成的広告推薦のためのエンドツーエンド・セマンティックID生成

生成モデルによる推薦（GR）はセマンティックID（SID）に依存するが、既存手法（RQ）は二段階圧縮による目的の不一致やエラー蓄積といった限界を持つ。 UniSIDフレームワークは、埋め込みとSIDをエンドツーエンドで共同最適化し、多粒度対照学習と要約ベースの再構築により、きめ細かな意味情報を捉える。実験の結果、UniSIDは既存手法を上回り、広告シナリオにおいてHit Rateを最大4.62%向上させることを実証した。

Action: 広告推薦システムにおけるUniSIDフレームワークの概念を調査し、自社システムへの応用可能性を検討する。

Original: End-to-End Semantic ID Generation for Generative Advertisement Recommendation domain ★★★

cs.LG updates on arXiv.org

非分離コストおよび制約を伴う分散オンライン凸最適化

本論文は、ネットワークシステムにおける分散オンライン制御に着想を得て、非分離コストおよび制約を伴う分散オンライン凸最適化問題を扱う。提案手法は、分散オンライン的共識アルゴリズムであり、累積制約違反(CCV)に関する既存の理論的障壁を打破する。このアルゴリズムは、通信オーバーヘッドを犠牲にして、時間 $T$ に対して $O(T^{1/2})$ の後悔とCCVの境界を達成し、オンライン制約付き凸最適化の下限に匹敵する。

Action: 分散システム制御や最適化アルゴリズムに携わる開発者は、提案された信念共識メカニズムの実装可能性や、特定ネットワーク制御アプリケーションにおける通信オーバーヘッドの影響を調査することを検討できます。

Original: Distributed Online Convex Optimization with Nonseparable Costs and Constraints domain ★★

cs.LG updates on arXiv.org

一度だけの計算: 効率的な大規模推薦モデルのためのUG-分離

大規模推薦モデルにおける高コストな推論問題を解決するため、ユーザーとアイテムの計算を分離する「UG-Sep」フレームワークを提案。マスク機構、情報補償戦略、W8A16量子化を組み合わせ、推論レイテンシを最大20%削減しつつパフォーマンスを維持。 Feed推薦や広告システムなど、複数のシナリオで大規模実験により有効性が確認された。

Action: 開発中の推薦システムにおいて、UG-Sepフレームワークや関連技術（マスク機構、情報補償、W8A16量子化）の導入を検討し、推論効率の改善効果を検証する。

Original: Compute Only Once: UG-Separation for Efficient Large Recommendation Models domain ★★★

cs.LG updates on arXiv.org

Found-RL: 基盤モデルで強化された自動運転向け強化学習

自動運転(AD)における強化学習(RL)のサンプル効率と解釈性の課題に対し、基盤モデル（VLM）を活用した「Found-RL」プラットフォームを提案。 VLMの推論遅延を非同期バッチ推論や蒸留メカニズムで解消し、リアルタイム学習を可能にする。軽量RLモデルが、大規模VLMに匹敵する性能を約500 FPSのリアルタイム推論で達成。コードとデータはGitHubで公開予定。

Action: https://github.com/ys-qu/found-rl で公開予定の Found-RL のコードとデータを確認し、自動運転における基盤モデル統合の技術動向を調査する。

Original: Found-RL: foundation model-enhanced reinforcement learning for autonomous driving domain ★★★

cs.LG updates on arXiv.org

波の散乱を用いたバックプロパゲーションのアンロック

機械学習のバックプロパゲーションと最適制御理論の最大原理は、「順・逆」のロック状態にある二点境界値問題として捉えられていた。最適制御理論の最大原理を、追加の「最適化時間」次元を導入した双曲型初期値問題として再定式化し、波の散乱関係を用いて最適化問題を再構築する。この連続体理論を離散化することで、ニューラルネットワークの学習に適した、完全にアンロックされたアルゴリズム群が導出される。

Action: 提案された波の散乱を利用したニューラルネットワーク学習アルゴリズムの理論的・実践的な詳細を調査し、その計算効率と収束性について評価する。

Original: Unlocked Backpropagation using Wave Scattering domain ★★★

cs.LG updates on arXiv.org

オンライン一般化平均厚生最大化：サンプルからのほぼ最適な後悔の達成

異種エージェント間でのアイテムのオンライン公正配分を研究し、一般化平均厚生（$p$-平均）の最大化を目指します。提案アルゴリズムは、分布知識不要でオンラインサンプルのみを使用し、ほぼ最適な $\widetilde{O}(1/T)$ の後悔（レグレット）を達成します。アルゴリズムは、非定常性や分布シフトに対しても、少量の過去データで頑健性を示します。

Action: オンラインアルゴリズムを用いた公平配分と後悔最小化手法について、実装可能性や応用事例を調査する。

Original: Online Generalized-mean Welfare Maximization: Achieving Near-Optimal Regret from Samples domain ★★★

cs.LG updates on arXiv.org

GPU-Fuzz: ディープラーニングフレームワークにおけるメモリバグの検出

ディープラーニングフレームワークにおいて、GPUメモリバグはクラッシュやセキュリティ問題を引き起こす重大な脅威です。 GPU-Fuzzは、制約ソルバーを用いてGPUカーネルの境界条件を体系的に探索し、メモリバグを効率的に検出するファザーです。 PyTorch、TensorFlow、PaddlePaddleに適用され、13件の未知のバグを発見し、その有効性を示しました。

Action: ディープラーニングフレームワークの信頼性向上とセキュリティ強化のため、GPU-Fuzzのようなメモリバグ検出手法（ファジング）の導入を検討する。

Original: GPU-Fuzz: Finding Memory Errors in Deep Learning Frameworks domain ★★★

cs.LG updates on arXiv.org

乗法的収益近似の価格設定クエリ複雑性

未知の分布からの単一バイヤーの収益最大化における価格設定クエリ複雑性を研究。単純な価格設定クエリだけでは分布のスケールを学習できないため、近似収益保証には「スケールヒント」が不可欠であることを示す。ワンサンプルヒントと値範囲ヒントのモデルで、特定クラスの分布に対するタイトなクエリ複雑性保証を確立。

Action: Eコマースやオンライン広告システムにおける、この理論的な価格設定複雑性の境界が実用的な収益最適化アルゴリズムにどう影響するかを検討する。

Original: Pricing Query Complexity of Multiplicative Revenue Approximation domain ★★

cs.LG updates on arXiv.org

Privacy-Utility Tradeoffs in Quantum Information Processing

Original: Privacy-Utility Tradeoffs in Quantum Information Processing domain ★

cs.LG updates on arXiv.org

Co-jump: マルチエージェント強化学習による四足ロボットの協調ジャンプ

四足ロボット2体による協調ジャンプ技術「Co-jump」を提案。マルチエージェント強化学習(MAPPO)とカリキュラム戦略で、通信なしに同期ジャンプを実現。単独ロボットの144%増となる1.1mの跳躍高を達成し、通信フリーの協調移動の基盤を構築。

Action: MAPPOアルゴリズムの実装またはシミュレーションを検討し、協調タスクにおけるロボットのパフォーマンス向上に応用できないか調査する。

Original: Co-jump: Cooperative Jumping with Quadrupedal Robots via Multi-Agent Reinforcement Learning domain ★★★

cs.LG updates on arXiv.org

LHAW: 長期タスクにおける制御可能な情報不足

長期間にわたる自律システムには、長期ワークフローエージェントが不可欠であり、曖昧な状況での明確化が重要です。 LHAW (Long-Horizon Augmented Workflows) は、タスクの目標、制約、入力、コンテキストを系統的に削減することで、任意のタスクを制御可能な過小指定されたバリアントに変換するモジュール式パイプラインです。 LHAWは、エージェントの明確化行動を評価するための最初の体系的なフレームワークを提供し、信頼性の高い自律システム開発を可能にします。

Action: LHAWフレームワークを調査し、開発中のエージェントにおける曖昧さの検出・解決能力の評価に活用することを検討する。

Original: LHAW: Controllable Underspecification for Long-Horizon Tasks domain ★★★

cs.LG updates on arXiv.org

高次元ノイズ下における一般化ロバスト適応帯域幅マルチビュー多様体学習

高次元かつノイズが多いマルチビューデータに対して、新しいカーネルベースの拡散幾何学フレームワーク「GRAB-MDM」を提案。 GRAB-MDMの革新的な点は、ビューごとに適応する帯域幅選択戦略であり、各ビューの幾何学的構造とノイズレベルに対応することで、安定したマルチビュー拡散演算子を構築。提案手法は、ノイズレベルやセンサー次元が異なる場合でも、共有された内在構造を頑健に復元し、既存手法よりも優れたロバスト性と埋め込み品質を提供する。

Action: 提案されたGRAB-MDMフレームワークを、実際のマルチビューセンサーデータセットに適用し、その頑健性と埋め込み品質を評価する。

Original: Generalized Robust Adaptive-Bandwidth Multi-View Manifold Learning in High Dimensions with Noise domain ★★

cs.LG updates on arXiv.org

崩壊から改善へ：汚染されたソースでの反復トレーニングの進化ダイナミクスの統計的視点

合成データを用いた反復学習におけるモデル崩壊問題に対処する。統計的視点から、真のターゲット分布からの情報が混入していれば、汚染されたソース（真の分布と合成分布の混合）からの学習でも改善の可能性があることを示す。適切なサンプルサイズと混合比率により、モデル崩壊を回避し、真のターゲット分布を回復できる場合があることを分析・シミュレーションで実証する。

Action: 生成モデルや言語モデル開発者は、合成データを含むデータセットを扱う際に、反復学習パイプラインへ本論文の統計的洞察を適用し、モデル崩壊を回避またはパフォーマンスを向上させる方法を検討すべきである。

Original: From Collapse to Improvement: Statistical Perspectives on the Evolutionary Dynamics of Iterative Training on Contaminated Sources domain ★★★

cs.LG updates on arXiv.org

SHAP（Shapley Additive Explanations）のための統計的推論と学習

SHAPフレームワークは、予測タスクにおける変数重要度の評価に不可欠だが、グローバルな特徴量重要度推定のための統計的推論手法が不足している。本研究では、SHAP値のべき乗に対する信頼度を推定するための半パラメトリックアプローチを提案し、漸近正規性を持つ推定量を構築する。また、経験的リスク最小化によるSHAP曲線学習のためのNeyman直交損失関数を提示し、モデルの解釈可能性向上と特徴量選択への応用を示唆する。

Action: SHAP値の統計的推論手法を調査し、モデルの解釈可能性向上や特徴量選択への応用可能性を検討する。

Original: Statistical Inference and Learning for Shapley Additive Explanations (SHAP) domain ★★

cs.LG updates on arXiv.org

エージェント型定理証明器はなぜ機能するのか：数学的推論モデルの統計的証明可能性理論

エージェント型定理証明器（モデル、ライブラリ検索、分解、検証器の連携）は、数学的推論の分野で目覚ましい成果を上げている。本論文では、「統計的証明可能性」を定義し、これらのシステムがなぜ成功するのかを、時間制限付きマルコフ決定過程 (MDP) として形式化する。理論は、現実世界の偏った問題分布での成功要因を説明し、最悪ケースや敵対的状況での限界を明らかにする。

Action: 「統計的証明可能性」の概念と、それがエージェント型定理証明器の性能にどう影響するかを調査し、関連する研究や実装への応用可能性を検討する。

Original: Why Agentic Theorem Prover Works: A Statistical Provability Theory of Mathematical Reasoning Models domain ★★★

cs.LG updates on arXiv.org

フーリエ特徴量と正確な解析的導関数によるPDEの一括解法

新手法「FastLSQ」は、三角関数的なフーリエ特徴量を利用して偏微分方程式（PDE）を効率的に解きます。導関数計算をO(1)で実現し、高コストな自動微分を回避することで、計算コストを大幅に削減します。線形・非線形PDEの両方において、既存のPINNソルバーを凌駕する速度と精度を達成します。

Action: PDEの高速・高精度解法であるFastLSQについて調査し、実際のシミュレーションや物理ベースAIモデルへの応用可能性を検討する。

Original: Solving PDEs in One Shot via Fourier Features with Exact Analytical Derivatives domain ★★★

cs.LG updates on arXiv.org

予測状態通信：遅延下でのイノベーション符号化と調整

「予測状態通信（PSC）」を提案：送信者と受信者が共有する予測状態を利用し、チャネルは革新情報（修正情報）のみを伝達することで状態を同期させる。エントロピー率ではなく、モデルミスマッチ下でのクロスエントロピーを指標とし、容量、遅延、知覚的連続性の要件に基づく実現可能性制約を導入する。プロトコルとアーキテクチャへの影響（状態識別子、アンカー、ロールバック、パッチ更新）を概説し、例を通じて実現可能性領域を可視化する。

Action: LLMなどの生成モデルを活用し、予測状態通信（PSC）の概念を実際の通信プロトコルとして実装・評価するための実験的ライブラリ開発を検討する。

Original: Predictive-State Communication: Innovation Coding and Reconciliation under Delay domain ★★

cs.LG updates on arXiv.org

ディープ・ブートストラップ

条件付き拡散モデルに基づくノンパラメトリック回帰のための新しいディープ・ブートストラップフレームワークを提案。推定、サンプリング、回帰を統一された生成フレームワークに統合。理論的保証と複雑な回帰タスクへの有効性を示唆。

Action: 拡散モデルを用いたノンパラメトリック回帰の概念を調査し、将来のデータ分析や予測モデルへの応用可能性を検討する。

Original: Deep Bootstrap domain ★★

cs.LG updates on arXiv.org

数ショット模倣学習における人間デモンストレーションへのフローベース一般化

模倣学習（IL）では、コストのかかる多数のデモンストレーションが必要となる。既存手法はフローを利用するが、インタラクションの動きや精密な詳細を捉え、一般化するには限界がある。提案手法SFCrP（SFCr + FCrP）は、シーンフロー予測と条件付きポリシーを用いることで、人間デモンストレーションからの一般化能力を向上させる。

Action: SFCrPモデルの論文を調査し、その実装方法やロボット学習への応用可能性を検討する。

Original: Flow-Enabled Generalization to Human Demonstrations in Few-Shot Imitation Learning domain ★★★

cs.LG updates on arXiv.org

深層強化学習のためのニューロシンボリック行動マスキング

深層強化学習 (DRL) における不可能な行動の探索問題を解決するため、NSAM (Neuro-symbolic Action Masking) フレームワークを提案。 NSAM は、最小限の教師データで高次元状態からシンボリックモデルを自動学習し、不適切な行動を排除するアクションマスクを生成する。シンボリック推論と深層ポリシー最適化を統合し、サンプル効率の向上と制約違反の削減に大きく貢献する。

Action: NSAMフレームワークの概念を理解し、深層強化学習プロジェクトへの適用可能性を調査・実験する。

Original: Neuro-symbolic Action Masking for Deep Reinforcement Learning domain ★★★

cs.LG updates on arXiv.org

経験的尤度を用いたコンテクスチュアルバンディットポリシーのベイズ推論

コンテクスチュアルバンディット問題におけるポリシー推論に焦点を当て、経験的尤度を用いたベイズ推論手法を提案。提案手法は、有限サンプル条件下での複数ポリシーの同時分析を可能にし、小標本サイズにも頑健で、正確な不確実性測定を提供。ポリシー比較における柔軟な推論と完全な不確実性定量化を実現し、シミュレーションと実データセットで有効性を示した。

Action: レコメンデーションシステムやA/Bテストフレームワークにおいて、コンテクスチュアルバンディットポリシーのための経験的尤度ベースのベイズ推論手法を実装・評価し、意思決定の精度と不確実性推定を向上させることを検討する。

Original: Bayesian Inference of Contextual Bandit Policies via Empirical Likelihood domain ★★★

cs.LG updates on arXiv.org

高適合主成分回帰

HAL/HARの計算コスト問題を解決するため、主成分分析（PCA）を導入したPCHAL/PCHARを提案。 PCHAL/PCHARは計算効率を大幅に向上させ、HAL/HARと同等の性能を達成。 HAL/HARのグラム演算子の主成分と離散正弦基底との間にスペクトル的関連性があり、フーリエ型構造を明らかに。

Action: PCHAL/PCHARアルゴリズムの実装を検討し、既存のデータ分析パイプラインでの利用可能性を評価する。

Original: Highly Adaptive Principal Component Regression domain ★★

cs.LG updates on arXiv.org

OmniSapiens: ヘテロジニアスを考慮した相対的ポリシー最適化によるソーシャルビヘイビア処理のための基盤モデル

既存のAIモデルは人間の行動的側面を個別に扱っており、コスト増加と汎化性能の低下を招いています。ヘテロジニアスなタスクやサンプル間での学習を均等化するため、HARPO（Heterogeneity-Aware Relative Policy Optimization）という新しい強化学習手法が提案されました。 HARPOを用いて開発された基盤モデルOmnisapiens-7B 2.0は、既存モデルを上回る性能と、より明示的で堅牢な推論能力を示しています。

Action: HARPO手法やOmnisapiens-7B 2.0モデルについて、GitHubリポジトリや論文を参照し、その応用可能性を調査する。

Original: OmniSapiens: A Foundation Model for Social Behavior Processing via Heterogeneity-Aware Relative Policy Optimization domain ★★★

cs.LG updates on arXiv.org

Beyond Kemeny Medians: Consensus Ranking Distributions Definition, Properties and Statistical Learning

Original: Beyond Kemeny Medians: Consensus Ranking Distributions Definition, Properties and Statistical Learning domain ★

cs.LG updates on arXiv.org

音声強調ネットワークにおける動的プルーニングマスクを用いた補助信号特性の推定

音声強調（SE）モデル内の動的プルーニングマスク（DynCP）を利用して、VAD、ノイズ分類、F0推定などの補助信号特性を、追加モデルなしで高精度（最大93%）に推定できることを示しました。この手法は、オンデバイスでの計算負荷と遅延を削減し、プライバシーを保護しながら、SEと信号特性推定を統合する効率的なソリューションを提供します。本研究は、DynCPモデルが下流タスク予測を通じて何を学習しているかを分析し、DynCPをSEと信号特性推定のための包括的なソリューションとして再提案します。

Action: 音声強調モデルに動的プルーニングマスク（DynCP）を導入し、VAD、ノイズ分類、F0推定などの補助タスクを単一モデルで効率的に処理する実験を行う。

Original: From Diet to Free Lunch: Estimating Auxiliary Signal Properties using Dynamic Pruning Masks in Speech Enhancement Networks domain ★★

cs.LG updates on arXiv.org

高次元の解けるモデル：非線形オートエンコーダーがPCAでは見えない構造を学習し、テスト損失が汎化と乖離するケース

高次元データセットにおけるPCAでは検出できない隠れた構造を、非線形ニューラルネットワーク（特にオートエンコーダー）が学習できることを実証しました。 PCAや線形オートエンコーダーでは捉えきれない、高次のモーメントに現れる隠れた要因を、最小限の非線形オートエンコーダーが抽出できることを理論的に分析しました。自己教師あり学習におけるテスト損失が、実際の表現品質と必ずしも一致しない（乖離する）という、実用上重要な現象の分析例を提供します。

Action: 高次元データにおける非線形モデルの構造抽出能力と、テスト損失の解釈に関する研究を調査し、自身のプロジェクトにおけるデータ分析手法の改善に役立てる。

Original: A solvable high-dimensional model where nonlinear autoencoders learn structure invisible to PCA while test loss misaligns with generalization domain ★★

cs.LG updates on arXiv.org

タスクパフォーマンスを超えて：異種マルチエージェント破壊的採餌における順次的協調のメトリックベース分析

異種マルチエージェントシステムにおける協調分析に焦点を当て、タスク完了だけでなく、効率性、調整、依存性、公平性、感度を測る新しいメトリックを提案。提案されたメトリックは、一次、チーム間、チーム内の3つのカテゴリに分類され、海洋表面清掃のような破壊的採餌シナリオで検証。学習ベースアルゴリズムと古典的なヒューリスティックアプローチの両方を評価し、実世界の応用可能性を示唆。

Action: 提案されたマルチエージェント協調メトリックを、既存のロボット/AIシステムへの適用可能性について調査する。

Original: Beyond Task Performance: A Metric-Based Analysis of Sequential Cooperation in Heterogeneous Multi-Agent Destructive Foraging domain ★★★

cs.LG updates on arXiv.org

スライス最適輸送を用いた分布マッチングの収束率

スライス最適輸送に基づく分布マッチング手法「スライス・マッチング・スキーム」を研究。 Sliced-Wasserstein目的関数に対するŁojasiewicz型不等式を確立し、非漸近的な収束率を定量的に導出。ガウス分布における理論的解析と、正規直交基底サンプリングによる安定化効果を数値実験で実証。

Action: スライス・マッチング・スキームの分布マッチングにおける実用的な適用可能性を調査し、特定の機械学習モデルでの性能評価や実装を検討する。

Original: Convergence Rates for Distribution Matching with Sliced Optimal Transport domain ★★

cs.LG updates on arXiv.org

観測データからの堅牢な品揃え最適化

顧客の選好の変動やモデルの誤りを考慮した、堅牢なデータ駆動型品揃え最適化フレームワークを提案。最悪ケースの期待収益を最大化するアプローチを採用し、統計的に最適なアルゴリズムにより、堅牢な一般化性能とサンプル複雑性の理論的保証を提供。「ロバストなアイテムごとのカバレッジ」が、サンプル効率の良い堅牢な品揃え学習に最低限必要なデータ要件であることを特定。

Action: 推薦システムやEコマースプラットフォームにおける、顧客選好の変動に対応できる堅牢な品揃え最適化アルゴリズムの実装可能性を調査する。

Original: Robust Assortment Optimization from Observational Data domain ★★

cs.LG updates on arXiv.org

費用対効果の高い検索：生成的推薦のための価値誘導構造化サンプリングと最適化

生成的推薦システムにおけるRLファインチューニングの課題（確率-報酬不一致、探索不足）に対し、V-STARフレームワークを提案。VEDによる探索効率向上とSibl-GRPOによる分岐決定への学習信号集中により、精度、多様性、レイテンシ制約下での性能を改善。

Action: V-STARフレームワークや価値誘導サンプリング技術を、既存の推薦システム、特にRLを用いたものに適用し、探索効率とレイテンシ制約下での性能への影響を評価する。

Original: Spend Search Where It Pays: Value-Guided Structured Sampling and Optimization for Generative Recommendation domain ★★★

cs.LG updates on arXiv.org

情報パスプランニングのための統一実験アーキテクチャ：GuadalPlannerによるシミュレーションからデプロイメントまで

自律走行車の情報パスプランニング（IPP）アルゴリズムは、断片化されたパイプラインにより、シミュレーションと実世界展開間での一貫した評価が困難という課題に直面しています。本論文では、GuadalPlannerという統一アーキテクチャを提案し、プランニングロジックと車両固有の制御を分離することで、抽象化レベルを超えた一貫した評価を可能にします。 GuadalPlannerはROS2などのロボティクス技術を基盤とし、様々な環境やプランニング戦略をサポートし、水質モニタリングのための実世界展開で検証されています。

Action: GuadalPlannerをロボティクスプロジェクトへの応用可能性について調査する。特にROS2連携やシミュレーションから実運用へのパイプライン機能に注目する。

Original: A Unified Experimental Architecture for Informative Path Planning: from Simulation to Deployment with GuadalPlanner domain ★★★

cs.LG updates on arXiv.org

自己教師あり学習に基づくコンテンツフリー・マルチモデル指向表現学習による超解像画像品質評価

現実世界の低解像度画像に対する超解像（SR）の品質評価（SR-IQA）は、予測不能な劣化のため困難である。本研究では、コンテンツに依存せず、異なるSRモデルの出力ペアを用いた自己教師あり学習（SSL）により、現実的なSR画像の品質を評価する新規手法「S3 RIQA」を提案する。新規データセットSRMORSSを用いて学習し、既存手法を上回る性能を示した。

Action: S3 RIQA手法やSRMORSSデータセットについて調査し、関連研究への応用可能性を検討する。

Original: Self-Supervised Image Super-Resolution Quality Assessment based on Content-Free Multi-Model Oriented Representation Learning domain ★★

cs.LG updates on arXiv.org

ハイパースペクトルデータ回帰のためのスペクトル空間対照学習フレームワーク

画像分類で成功している対照学習は、ハイパースペクトルデータを用いた回帰タスクでは研究が不足しています。本論文では、3D CNNやTransformerなどのバックボーンを強化できる、モデル非依存のスペクトル空間対照学習フレームワークを提案します。ハイパースペクトルデータ向けの変換手法も提供され、実験によりバックボーンモデルの性能が大幅に向上することが示されています。

Action: 提案されたスペクトル空間対照学習フレームワークを、他の回帰タスクやデータモダリティに適用することを検討する。

Original: Spectral-Spatial Contrastive Learning Framework for Regression on Hyperspectral Data domain ★★

cs.LG updates on arXiv.org

SecureScan: ロジスティック回帰と脅威インテリジェンス統合を用いたAI駆動型多層マルウェア・フィッシング検出フレームワーク

SecureScanは、ロジスティック回帰、ヒューリスティック分析、VirusTotal APIを統合したAI駆動型3層検出フレームワークです。 URL、ファイルハッシュ、バイナリの包括的なトリアージを行い、未知の脅威を効率的に検出・分類します。ベンチマークデータセットで93.1%の精度を達成し、統計モデルと外部インテリジェンスの組み合わせが深層学習システムに匹敵する信頼性を持つことを示しています。

Action: SecureScanのアーキテクチャ（ロジスティック回帰、ヒューリスティック分析、外部脅威インテリジェンス連携）を調査し、自社サービスへの応用可能性を検討する。

Original: SecureScan: An AI-Driven Multi-Layer Framework for Malware and Phishing Detection Using Logistic Regression and Threat Intelligence Integration domain ★★★

cs.LG updates on arXiv.org

拡散内Gibbsサンプリングを用いたベイズ信号成分分解

センサーデータはノイズ混じりの信号成分の重ね合わせであり、成分推定は重要な前処理ステップです。本研究では、GibbsサンプリングとPnP拡散事前分布を組み合わせたベイズ信号成分分解フレームワーク（DiGサンプラー）を開発しました。このフレームワークは、事前知識の柔軟な組み込みを可能にし、実験で既存手法を上回る性能を示しました。

Action: DiGサンプラーのアルゴリズムと実装の詳細を調査し、信号処理分野における実応用可能性を評価する。

Original: Bayesian Signal Component Decomposition via Diffusion-within-Gibbs Sampling domain ★★

cs.LG updates on arXiv.org

ブラックボックスLLMの知識境界を表現するための深層学習ベースの方法

LLMのハルシネーションは、特にブラックボックスモデルにおいて、自身の知識境界への認識不足が根本原因です。本論文は、知識蒸留を用いた深層学習手法LSCLを提案し、入力とトークン確率からブラックボックスLLMの内部知識状態へのマッピングを行い、知識境界を定量化・表現します。実験により、LSCLは精度と再現率で既存手法を大幅に上回り、トークン確率が利用できない場合のアダプティブ手法も高い性能を示しました。

Action: ブラックボックスLLMのハルシネーションを理解・軽減するために、LSCL手法の実装や実験を検討する。特にAPIアクセスのみ提供されるモデルでの応用を視野に入れる。

Original: Deep Learning-based Method for Expressing Knowledge Boundary of Black-Box LLM domain ★★★

cs.LG updates on arXiv.org

なぜRLはSFTよりも一般化に優れるのか？ VLM事後学習に関するデータ中心の視点

RLはVLMの事後学習において、中程度の難易度サンプルを暗黙的に優先するフィルタリングにより、SFTよりも優れたOOD汎化性能を示すと提案。データ難易度が汎化性能に重要であることを発見し、難易度ベースで学習データをフィルタリングするDC-SFTを導入。 DC-SFTは、標準SFTを大幅に上回り、RLベースの学習をも超える汎化性能、安定性、効率性を提供することを示した。

Action: DC-SFT手法を調査し、VLMの一般化性能向上のために自社モデルへの適用可能性を検討する。

Original: Why Does RL Generalize Better Than SFT? A Data-Centric Perspective on VLM Post-Training domain ★★★

cs.LG updates on arXiv.org

話者認識のための自己教師あり学習：研究とレビュー

自己教師あり学習（SSL）は、教師ありモデルの限界と大量のラベルなしデータを活用するため、話者認識（SR）において重要です。本研究は、話者認識に適用されたSSLフレームワーク（SimCLR、MoCo、DINO）をレビューし、ハイパーパラメータやコンポーネントの影響を分析します。 DINOは最高の性能を示しますがチューニングに敏感であり、SimCLR/MoCoは話者間変動を捉えるための堅牢な代替手段を提供します。

Action: 音声処理パイプラインにおける話者認識のために、DINOまたはSimCLR/MoCoフレームワークの実装を調査する。

Original: Self-Supervised Learning for Speaker Recognition: A study and review domain ★★★

cs.LG updates on arXiv.org

SynergyKGC: トポロジー認識型シナジーによる知識グラフ補完におけるトポロジー的不均一性の調整

既存の知識グラフ補完 (KGC) 手法は、グラフの密度差によるノイズや表現崩壊の問題を抱えていました。本研究で提案する SynergyKGC は、クロスモーダルシナジーエキスパートと密度依存型IDアンカリングにより、トポロジーの不均一性を効果的に調整します。公開ベンチマークでの評価により、KGCの精度を大幅に向上させることが実証されました。

Action: SynergyKGCの提案手法（クロスモーダルシナジーエキスパート、密度依存型IDアンカリング）を調査し、既存の知識グラフ補完システムへの適用可能性を検討する。

Original: SynergyKGC: Reconciling Topological Heterogeneity in Knowledge Graph Completion via Topology-Aware Synergy domain ★★★

cs.LG updates on arXiv.org

階層的スペクトル法を用いた構成的ターゲットの深層学習

高次元ガウス設定で、複合的ターゲット関数に対する深層学習の利点を研究。層ごとのスペクトル推定器を用いた3層モデルが、中間表現を通じて入力レベルでは得られない構造を捉え、学習を単純化できることを示唆。ガウス普遍性に基づく分析により、2層および3層学習戦略間のサンプル複雑度に明確な差があることを示す。

Action: 複合的関数を扱う深層学習モデルに対し、層ごとのスペクトル推定器の実装を検討し、そのサンプル複雑度における利点を調査する。

Original: Deep Learning of Compositional Targets with Hierarchical Spectral Methods domain ★★★

cs.LG updates on arXiv.org

メタアナリシスにおけるLLMベース証拠抽出の構造的失敗の診断

LLMは、メタアナリシスに必要な、役割、手法、効果量帰属などの構造的要件を満たせていない。変数、役割、統計手法、効果量間の安定した関連付けが必要なタスクでは、LLMの性能が著しく低下し、体系的な構造崩壊を引き起こす。現在のLLMは、自動メタアナリシスに不可欠な構造的忠実性や数値的根拠を欠いており、結果の集計でエラーが増幅される。

Action: LLMによる証拠抽出において、メタアナリシスに必要な構造的整合性（変数、手法、効果量の正確な紐付け）を向上させるための、新しいフレームワークやプロンプトエンジニアリング手法を研究・開発する。

Original: Diagnosing Structural Failures in LLM-Based Evidence Extraction for Meta-Analysis domain ★★★

cs.LG updates on arXiv.org

自己進化型ルーブリックによる思考連鎖推論の強化

LLMの思考連鎖(CoT)推論を、人間によるアノテーションなしで、かつ進化するルーブリックを用いて自律的に強化する手法「RLCER」を提案。既存の報酬モデルの課題（ラベリングコスト、進化への対応不足、報酬ハッキング）を克服し、より信頼性の高いCoT教師信号を提供。 RLCERで生成されたルーブリックは、推論時のヒントとしても有効であり、LLMの性能向上に貢献する。

Action: RLCER手法の実現可能性を調査し、`web-file-bin` プロジェクトのAI機能への応用を検討する。

Original: Reinforcing Chain-of-Thought Reasoning with Self-Evolving Rubrics domain ★★★

cs.LG updates on arXiv.org

大規模電力網における機械学習アルゴリズムを用いた異常検知

大規模電力網の運用データに対し、複数の機械学習アルゴリズムを異常検知に応用。アルゴリズム間で性能差が見られ、ニューラルネットワークは文脈依存性の高い異常に対して古典的アルゴリズム（k-NN, SVM）を上回る性能を示した。教師なし学習アルゴリズムは、同時発生する複数の異常に対しても堅牢な予測が可能であった。

Action: 大規模システムにおける異常検知のため、教師なし学習アルゴリズムの適用可能性を調査し、文脈依存性の高い異常に対するモデルの頑健性を評価する。

Original: Anomaly Detection with Machine Learning Algorithms in Large-Scale Power Grids domain ★★

cs.LG updates on arXiv.org

SoftMatcha 2: 数兆規模コーパスのための高速かつソフトなパターンマッチャー

提案手法は、数兆トークン規模の自然言語コーパスに対し、0.3秒未満で意味的なバリエーション（置換、挿入、削除）を考慮した検索を可能にする超高速・柔軟なアルゴリズムです。ディスク認識設計と動的なコーパス認識プルーニングを組み合わせたサフィックス配列ベースの文字列マッチングにより、検索空間の指数関数的増加を抑制します。既存手法（infini-gram等）よりも低遅延を達成し、トレーニングコーパスのベンチマーク汚染検出に実用的応用が見込まれます。

Action: 提案されているSoftMatcha 2アルゴリズムのアーキテクチャと、そのパフォーマンスを支えるディスク認識設計およびコーパス認識プルーニングの詳細を調査し、類似の大規模テキストデータ処理タスクへの応用可能性を検討する。

Original: SoftMatcha 2: A Fast and Soft Pattern Matcher for Trillion-Scale Corpora domain ★★

cs.LG updates on arXiv.org

深層における最適な初期化：Lyapunov初期化とディープ・リーキーReLUネットワークの極限定理

深層のアンバイアスなLeaky ReLUネットワークを確率論的に解析し、LLNとCLTを証明。ネットワーク活性化の対数成長がLyapunov指数によって制御され、消滅・爆発の相転移を引き起こすことを示す。標準的な初期化法が深層低幅ネットワークで不安定になることを示し、安定性を高めるLyapunov初期化法を提案。

Action: Lyapunov初期化手法の理論的根拠を調査し、既存の深層学習モデルへの適用可能性を評価する。

Original: Optimal Initialization in Depth: Lyapunov Initialization and Limit Theorems for Deep Leaky ReLU Networks domain ★★★

cs.LG updates on arXiv.org

健康な収穫：InceptionV3を用いたグアバ病害分類の比較

グアバの病害早期特定は品質と収穫量維持に不可欠。 InceptionV3 (98.15%精度) と ResNet50 (94.46%精度) を用いた病害分類研究。データ拡張、CutMix/MixUp、SHAP分析によるモデルの頑健性と解釈可能性向上。

Action: 画像分類タスクにInceptionV3やResNet50などの深層学習モデルを適用する方法を調査し、SHAP分析によるモデルの解釈可能性向上を検討する。

Original: Healthy Harvests: A Comparative Look at Guava Disease Classification Using InceptionV3 domain ★★

cs.LG updates on arXiv.org

生成拡散モデルにおけるフォマープロセスの変分最適性

確率的補間フレームワークを用いて、点質量を所定のターゲット分布へ輸送する生成拡散モデルを構築・分析する。拡散係数は事後的に調整可能であり、相対エントロピーを最小化するフォマープロセスを選択できることを示す。これにより、フォマープロセスの新たな変分的特徴付けが得られ、最適化された係数下ではパス空間KLダイバージェンスが補間スケジュールに依存しなくなる。

Action: 生成拡散モデルやフォマープロセスに関する最新の研究動向を調査し、既存のAIプロジェクトへの応用可能性を検討する。

Original: Variational Optimality of F\"ollmer Processes in Generative Diffusions domain ★★★

cs.LG updates on arXiv.org

コミュニケーションする人工エージェントにおける数値表現の出現

コミュニケーション圧力が人工エージェントに数値表現を生じさせるか、またそれが人間の数詞に似るかを調査。学習済みの数値を高精度で伝達できたが、未学習の数値に対する汎化（構造的メッセージ生成）は失敗した。数値伝達にはコミュニケーション圧力で十分だが、構造化されたコードや汎化能力には追加の圧力が必要と結論づけられた。

Action: 参照: エージェント間のコミュニケーションにおける数値表現の出現と汎化能力に関する研究。LLMの対話データにおける同様の現象の分析や、構造化されたコミュニケーションプロトコルの実装を検討する。

Original: The emergence of numerical representations in communicating artificial agents domain ★★★

cs.LG updates on arXiv.org

GPT-5をGPUカーネル生成のためにファインチューニングする

1. GPUカーネル生成の難しさ、LLMの限界（データ不足、コンパイラバイアス）を指摘。 2. 強化学習（RL）を用いたファインチューニング手法（Makora）を提案し、GPT-5でTritonコード生成の性能を大幅に向上。 3. RLによる特化ドメインでのLLM能力解禁の可能性と、AI支援アクセラレータプログラミングへの新経路を示唆。

Action: RLを用いたLLMのファインチューニング手法を、GPUカーネル生成以外の専門的なコード生成タスク（例: 特定のフレームワーク向けコード、組み込みシステム向けコードなど）へ応用する可能性を検討する。

Original: Fine-Tuning GPT-5 for GPU Kernel Generation domain ★★★

cs.LG updates on arXiv.org

瞬間的量子多項式回路ボーンマシンの学習可能性の特性評価

瞬間的量子多項式回路ボーンマシン（IQP-QCBMs）を量子生成モデルとして扱い、その学習可能性について調査。 MMD損失関数における勾配消失（barren plateau）問題と、特定のカーネルや初期化戦略（ガウス分布など）による緩和可能性を分析。スパースなIQPファミリーは、古典的に解読困難な確率分布を出力しつつ、初期段階でも学習可能であることを示唆。

Action: 量子機械学習モデルの学習可能性と量子優位性の関係について、最新の研究動向を調査する。

Original: Characterizing Trainability of Instantaneous Quantum Polynomial Circuit Born Machines domain ★★

cs.LG updates on arXiv.org

拡散モデル事前分布に基づく逆問題のためのギブスポステリアサンプラー

本論文は、線形変換と加法ノイズで観測系をモデル化し、ベイズ的枠組みで拡散モデルを事前分布として用いる逆問題における後方サンプリング手法を提案する。新規のギブスアルゴリズムを導入し、その有効性、単純さ、収束保証を示す。数値シミュレーションにより、提案手法の有効性が確認された。

Action: 拡散モデルを用いた逆問題におけるGibbsサンプラーの実装を検討し、その効率と収束性を検証する。

Original: A Gibbs posterior sampler for inverse problem based on prior diffusion model domain ★★

cs.LG updates on arXiv.org

SteuerLLM: ドイツ税法分析のためのローカル特化型大規模言語モデル

LLMは厳密なルール、専門用語、法的な構造を持つ税法のようなドメインで性能が低下する課題がある。「SteuerLLM」は、ドイツの税法試験問題に基づいた新しいベンチマーク「SteuerEx」と、それに対応するドメイン特化型LLMであり、一般的なモデルを上回る性能を示す。モデルの重み、データセット、評価コードが公開され、Webデモも利用可能である。

Action: SteuerLLMのWebデモ (https://steuerllm.i5.ai.fau.de) を試してみる。

Original: SteuerLLM: Local specialized large language model for German tax law analysis domain ★★

cs.LG updates on arXiv.org

第一回国際StepUPコンペティション：生体足跡認識 – 手法、結果、そして残された課題

生体足跡認識は、歩行時の足裏の圧力パターンを利用する新興分野だが、汎化性能向上のための大規模データセットが不足していた。最新の「UNB StepUP-P150」データセットを記念し、第一回国際StepUPコンペティションが開催され、23チームが参加した。最優秀チームはGRM最適化戦略で10.77% EERを達成したが、未知の履物への汎化には依然として課題が残る。

Action: 生体足跡認識の分野における最新の深層学習モデルやGRM最適化戦略について調査し、汎化性能向上のためのアプローチを検討する。

Original: First International StepUP Competition for Biometric Footstep Recognition: Methods, Results and Remaining Challenges domain ★★

cs.LG updates on arXiv.org

Renet: 動的目的選択によるElastic Netのための、原則に沿った効率的な緩和手法

RenetはElastic Netの収縮バイアスによる予測精度の低下を解決するため、動的目的選択を用いる新しい緩和フレームワークです。逐次的な緩和手法とサブパス再適合を組み合わせ、符号の一貫性を強制することで、予測精度を維持しつつ、よりロバストな手法を提供します。「1標準誤差ルール」との相乗効果により、予測忠実度を損なうことなく、モデルの簡潔性を高めることができ、多様な高次元データセットで既存手法を上回る性能を示します。

Action: Renetアルゴリズムの実装や、既存の機械学習パイプラインへの適用可能性を調査する。

Original: Renet: Principled and Efficient Relaxation for the Elastic Net via Dynamic Objective Selection domain ★★★

cs.LG updates on arXiv.org

クロスドメインエージェントワークフロー生成のためのコンポジション学習

複雑なタスクにはエージェントワークフローが必要だが、現在の手法はドメインシフトに弱い。新しい「分解-再構成-決定」メカニズムを持つLLMが、単一パスでのクロスドメインワークフロー生成を可能にする。このアプローチは、既存手法と比較してイテレーションコストと生成レイテンシを大幅に削減する。

Action: 提案された 'decompose-recompose-decide' メカニズムを調査し、自社のワークフロー生成システムへの応用を検討する。

Original: Learning to Compose for Cross-domain Agentic Workflow Generation domain ★★★

cs.LG updates on arXiv.org

LCIP: 高次元画像データの損失制御逆投影

現在の逆投影法($P^{-1}$)は、データ空間の多様性を十分にカバーできない固定的な表面構造しか生成できないという根本的な限界があります。本研究では、ユーザー制御下でデータ空間を「スイープ」できる新しい手法を提案します。この手法は、任意の投影手法($P$)およびデータセットに対して汎用的に機能します。 2つの直感的なパラメータで制御可能で実装も容易であり、スタイル転送のための画像操作など、広範な応用が実証されています。

Action: 損失制御逆投影法を画像スタイル転送のために簡易実装し、その効果を検証する。

Original: LCIP: Loss-Controlled Inverse Projection of High-Dimensional Image Data domain ★★★

cs.LG updates on arXiv.org

正規化フローを用いたデータ効率的な階層型目標条件付き強化学習

階層型強化学習のデータ効率と表現力の低さを、正規化フローを用いたNF-HIQLフレームワークで解決。 NF-HIQLは、多峰性行動のモデリングを可能にし、理論的保証と実証実験でデータ効率と汎化性能の向上を示した。長距離タスクにおいて既存手法を凌駕し、データ不足環境での頑健性を実証。

Action: NF-HIQLのアーキテクチャを調査し、小規模なタスクで実験的に実装する。

Original: Data-Efficient Hierarchical Goal-Conditioned Reinforcement Learning via Normalizing Flows domain ★★★

cs.LG updates on arXiv.org

機械学習のためのランダムパス散乱変換 (SCRAPL)

ニューラルネットワーク学習における散乱変換の計算コスト問題を解決するため、ランダムパスを用いた効率的な散乱変換（SCRAPL）を提案。特に時間周波数散乱変換（JTFS）に適用し、音声テクスチャ解析に利用。重要度サンプリングに基づく初期化手法を導入し、学習の収束性と評価性能を向上。コードはPythonパッケージとして公開。

Action: SCRAPL Pythonパッケージを調査し、音声処理タスクへの適用可能性を検討する。

Original: SCRAPL: Scattering Transform with Random Paths for Machine Learning domain ★★★

cs.LG updates on arXiv.org

YOR：汎用ロボットのためのあなた自身のモバイルマニピュレータ

YORは、オープンソースで低コストなモバイルマニピュレータであり、全方向移動ベース、伸縮式垂直リフト、2本の腕とグリッパーを統合しています。モジュール設計と既製部品による容易な組み立て、10,000ドル未満の材料費で、高度な全身制御、両腕操作、自律ナビゲーションを可能にします。既存プラットフォームのコストの一部で、モバイル操作研究に競争力のある機能を提供します。

Action: YORプロジェクトのウェブサイト（https://www.yourownrobot.ai/）を確認し、オープンソースの設計ドキュメントや部品リストを調査する。

Original: YOR: Your Own Mobile Manipulator for Generalizable Robotics domain ★★

cs.LG updates on arXiv.org

ニューラルおよび行動データのためのマルチモーダルガウス過程変分オートエンコーダー

神経科学におけるニューラル活動と行動データの関係性解明を目指し、複数のデータモダリティ（神経、行動）にまたがる共有・独立した潜在変数を抽出するマルチモーダルLVM (MM-GPVAE)を提案。 GPFAとGP-VAEを組み合わせ、時間的に滑らかな潜在空間と豊富な表現力を実現。Fourierドメインでの潜在変数パラメータ化により、標準的なGP-VAEより優れた潜在変数同定を示す。シミュレーションデータおよび実際の神経科学実験データ（ショウジョウバエ、Manduca sexta）でモデルを検証し、共有・独立な潜在構造の正確な同定と良好な再構成能力を示した。

Action: この研究で提案されているマルチモーダルGP-VAEの実装や、関連するライブラリ（TensorFlow Probability, PyTorch Geometricなど）の調査を検討する。

Original: Multi-modal Gaussian Process Variational Autoencoders for Neural and Behavioral Data domain ★★

cs.LG updates on arXiv.org

気候変動の影響を受ける部分観測環境における学習ベースの農業管理

深層強化学習（DRL）とリカレントニューラルネットワーク（RNN）を統合し、気候変動下での窒素肥料管理の最適化を目指す。 Gym-DSSATシミュレータを用い、POMDPとMDPモデルを比較。逐次観測の利点と、気候変動（特に異常気象）が収穫量や環境に与える影響を分析。固定ポリシーは軽微な変動には有効だが、極端な気象イベントにはエージェントの再学習による適応的な肥料戦略が必要であることを実証。

Action: 気候変動のような環境変動がある分野において、DRLを用いた最適化手法を他のドメイン（例：エネルギー管理、物流）へ応用することを検討する。

Original: Learning-based agricultural management in partially observable environments subject to climate variability domain ★★

cs.LG updates on arXiv.org

L^2正則化非線形ネットワークにおけるディープニューラルコラプスと低ランクバイアスの証明可能な出現

$L^2$重み減衰正則化で訓練された非線形ネットワークにおけるディープニューラルコラプス（DNC1）と低ランクバイアスの出現を理論的に結びつける。中間埋め込みの総クラスタ変動（TCV）と重み行列のランクとの定量的な関係を導出し、制約付き設定でのDNC1の全体最適性を証明する。 DNC1を満たす構成に対する「健全なランドスケープ」特性を確立し、理論的主張を経験的に検証する。

Action: $L^2$重み減衰がネットワークの潜在的特性（低ランクバイアス、ニューラルコラプス）に与える影響を理解し、実際のモデルで理論的関係性を検証するための実験を計画・実施する。

Original: Provable Emergence of Deep Neural Collapse and Low-Rank Bias in $L^2$-Regularized Nonlinear Networks domain ★★

cs.LG updates on arXiv.org

サブ最適データからの目標条件付き強化学習（Metric Spaces上）

目標条件付きオフライン強化学習における、サブ最適データからの学習課題に対応。分布シフトを軽減するため、メトリック学習と重み付き模倣学習を組み合わせたMetricRLを提案。深刻なサブ最適データに対しても、近最適行動を回復する有効性を示し、既存手法を上回る。

Action: MetricRLのアルゴリズム詳細を調査し、実際の強化学習タスクで実装・評価する。

Original: Goal-Conditioned Reinforcement Learning from Sub-Optimal Data on Metric Spaces domain ★★★

cs.LG updates on arXiv.org

カーネルベース最適重み付き共形時系列予測

時系列データのための新しい共形予測手法「カーネルベース最適重み付き共形予測区間（KOWCPI）」を提案。依存データに対する分位数回帰のため、古典的なRNW推定量に適応し、最適なデータ適応重みを学習する。非交換可能データに対し、カバレッジを失うことなくより狭い信頼区間を達成する。

Action: KOWCPI手法の実装ライブラリがないか調査し、可能であればプロジェクトに適用する。

Original: Kernel-based Optimally Weighted Conformal Time-Series Prediction domain ★★★

cs.LG updates on arXiv.org

時間経過に伴う条件付き平均潜在的結果推定のためのIGC-Net

観測データから時間経過に伴う潜在的結果を推定することは、個別化医療において重要ですが、既存手法は時間変動交絡因子への対応が不十分でバイアスを生じさせやすいです。本研究では、時間変動交絡因子を調整し、時間経過に伴う条件付き平均潜在的結果（CAPOs）を推定する新しいニューラルモデル「IGC-Net」（反復G-計算ネットワーク）を提案します。 IGC-Netは、時間変動設定におけるCAPO推定のために、回帰ベースの反復G-計算を完全に行う初のニューラルモデルであり、電子健康記録からの意思決定に大きく貢献します。

Action: 時間変動交絡因子を考慮した潜在的結果推定のためのIGC-Netのような因果推論モデルの実装や、関連ライブラリ（例：EconML, DoWhy）の調査を検討する。

Original: IGC-Net for conditional average potential outcome estimation over time domain ★★★

cs.LG updates on arXiv.org

大規模言語モデルにおける知識蓄積による熟練したグラフニューラルネットワーク設計

LLMは、グラフ構造とアーキテクチャの関係性に関する知識不足やノイズにより、GNN設計のような専門タスクが苦手です。本研究では、過去のGNN設計経験を構造化された知識としてLLMのメタ学習に活用するフレームワーク「DesiGNN」を提案します。 DesiGNNは、ベンチマークデータとLLMによる文献洞察を組み合わせ、未見のデータセットに対して迅速かつ高性能なGNNモデル提案を実現します。

Action: GNN設計におけるLLMの活用方法、特にDesiGNNフレームワークの知見を自身のプロジェクトへ応用する可能性を調査する。

Original: Proficient Graph Neural Network Design by Accumulating Knowledge on Large Language Models domain ★★★

cs.LG updates on arXiv.org

不確実性分離における盲点としての直交性の測定

Aleatoric（データ）とepistemic（知識）の不確実性を分離する手法が提案されており、それらの評価方法が不十分であるという課題を指摘。不確実性分離には「直交性」と「一貫性」が本質的であり、それを測る指標としてUDE（Uncertainty Disentanglement Error）を構築。実験により、ファインチューンモデルとスクラッチ学習モデルで直交性の結果が異なり、UDEが最適化可能であることを示唆。

Action: 提案されているUDE（Uncertainty Disentanglement Error）メトリックを、不確実性分離の評価に活用する方法を調査する。

Original: Measuring Orthogonality as the Blind-Spot of Uncertainty Disentanglement domain ★★

cs.LG updates on arXiv.org

報酬整形における動的情報のエンコーディングを通じた逆強化学習の強化

・確率的環境における敵対的逆強化学習（AIRL）の性能低下問題に対処。・遷移モデル推定を報酬整形に統合した「モデル強化型AIRL」を提案し、動的情報を取り込み理論的保証を付与。・MuJoCoベンチマークでの実験により、確率的環境で優れた性能とサンプル効率の向上を達成。

Action: 提案されたモデル強化型AIRLフレームワークを、MuJoCoベンチマークなどの環境で再現・検証する。

Original: Enhancing Inverse Reinforcement Learning through Encoding Dynamic Information in Reward Shaping domain ★★

cs.LG updates on arXiv.org

垂直連邦学習におけるプライバシー保証付きラベルアンラーニング：開示なしの少数ショット忘却に向けて

垂直連邦学習（VFL）におけるラベルアンラーニングの課題に取り組み、開示を伴わない少数ショット忘却を実現する手法を提案。マニフォールドミキシングを用いた合成埋め込み生成と、勾配ベースの忘却・回復フェーズ最適化により、効率的なアンラーニングと性能維持を両立。 MNIST、CIFAR-10など多様なデータセットでの実験により有効性とスケーラビリティを実証。コードはGitHubで公開。

Action: GitHubで公開されている、垂直連邦学習におけるプライバシー保証付きラベルアンラーニング手法の実装を確認し、自身のプロジェクトへの応用可能性を検討する。

Original: Towards Privacy-Guaranteed Label Unlearning in Vertical Federated Learning: Few-Shot Forgetting without Disclosure domain ★★★

cs.LG updates on arXiv.org

オフライン強化学習のためのハイパーキューブ方策正則化フレームワーク

オフライン強化学習（RL）は、データセット外（OOD）の状態・行動の問題に直面しています。既存の方策正則化手法は単純だが保守的すぎ、低品質データセットでは性能が低下します。提案されたハイパーキューブ正則化フレームワークは、類似状態の行動探索を可能にし、低品質データセットでの有効性を高め、TD3-BC-CとDiffusion-QL-Cで性能向上を示しました。

Action: 提案されたハイパーキューブ方策正則化フレームワークの概念を理解し、オフライン強化学習タスクにおけるその応用可能性について調査する。特に、低品質データセットでの性能向上が期待できるため、データ分析やトレンド予測への適用を検討する。

Original: Hypercube Policy Regularization Framework for Offline Reinforcement Learning domain ★★

cs.LG updates on arXiv.org

HypeRL：パラメータ化された動的システムの制御のためのハイパーネットワークベース強化学習

本論文では、パラメータ化された動的システムの最適制御のための新しい汎用強化学習戦略であるHypeRLを提案します。 HypeRLは、ハイパーネットワークを用いてポリシーおよび価値関数ニューラルネットワークの重みとバイアスを学習し、パラメータ情報を効果的に埋め込みます。 Kuramoto-Sivashinsky方程式と2次元ジャイア流のナビゲーション問題で検証され、ハイパーネットワークによるパラメータ依存性制御ポリシー学習の重要性を示しました。

Action: HypeRLフレームワークの実装を調査し、ロボット制御やシステム最適化など、プロジェクトに関連するパラメータ化された動的システムへの応用を検討する。

Original: HypeRL: Hypernetwork-Based Reinforcement Learning for Control of Parametrized Dynamical Systems domain ★★★

cs.LG updates on arXiv.org

分類における近似ガウス推論の再考

分類タスクにおいて、softmaxはaleatoric uncertaintyのみを捉える。epistemic uncertaintyを捉えるため、近似ガウス推論を提案し、softmaxの代わりにnormCDF/sigmoidを用いることでMCサンプリング不要な高速近似手法を開発。 ImageNet等のデータセットで評価し、既存手法と比較して不確実性定量化の改善を確認。コードも公開されている。

Action: 公開されているコード (`https://github.com/bmucsanyi/probit`) を参照し、本手法の分類モデルへの適用可能性を検討する。

Original: Rethinking Approximate Gaussian Inference in Classification domain ★★

cs.LG updates on arXiv.org

拡散モデルの反復的尤度ファインチューニング

拡散モデルは生成モデリングに重要ですが、事後分布からの効率的なサンプリングが課題です。本研究では、パスベースの重要度重みでリサンプリングされた合成データセットを用いて、最適な制御を学習することで拡散モデルをファインチューニングする自己教師ありアルゴリズムを提案します。このフレームワークは、テキストから画像への拡散モデルにおけるクラス条件付きサンプリング、逆問題、報酬ファインチューニングなどで有効性が示されています。

Action: この論文で提案されている反復的尤度ファインチューニング手法を調査し、既存の拡散モデルへの適用可能性を検討する。

Original: Iterative Importance Fine-tuning of Diffusion Models domain ★★★

cs.LG updates on arXiv.org

LLMエージェントにおける信念の固定化から頑健な推論へ

LLM推論におけるマルチエージェントディベート(MAD)は、初期の固定的な信念と多数派を増幅する画一的な議論により、誤りを強化する「信念の固定化」に悩まされている。本論文では、事前知識の引き出しで初期信念を修正し、議論の多様性を強制することで信念の固定化を緩和する「DReaMAD」フレームワークを提案する。 MetaNIM Arenaベンチマークで検証されたDReaMADは、信念の固定化を大幅に緩和し、ReActや標準MADを凌駕する精度向上と勝率向上を達成した。

Action: LLMエージェントの推論能力向上のため、DReaMADフレームワークとその実装詳細について調査する。

Original: From Belief Entrenchment to Robust Reasoning in LLM Agents domain ★★★

cs.LG updates on arXiv.org

ItDPDM: 情報理論的離散ポアソン拡散モデル

本論文は、情報理論的離散ポアソン拡散モデル（ItDPDM）を提案し、離散データの生成モデリングにおける課題に対処します。 ItDPDMは、完全な離散状態と情報理論的ポアソン再構成損失（PRL）を用いて、連続埋め込みと不正確な尤度最適化の限界を克服し、正確な尤度推定を実現します。本モデルは、合成データおよび記号音楽や画像などの実世界のデータセットにおいて、尤度およびサンプリング品質で優れた性能を示します。

Action: 離散データ生成のためのItDPDMの実装を検討し、性能を評価する。

Original: ItDPDM: Information-Theoretic Discrete Poisson Diffusion Model domain ★★★

cs.LG updates on arXiv.org

ハイブリッドMamba-Transformerによる時空間場生成と物理情報ファインチューニング

データ駆動型モデルにおける時空間物理場の生成課題（物理方程式の不一致）に対処。ハイブリッドMamba-Transformerアーキテクチャに基づくHMT-PFモデルを開発。物理情報によるファインチューニングブロックで誤差を低減。点クエリ機構と自己教師あり学習で物理的一貫性を保ちつつ、精度と現実性を向上。MSE-Rで評価。

Action: HMT-PFモデルおよび物理情報ファインチューニング技術を調査し、他のシミュレーションやデータ生成タスクへの応用可能性を探る。

Original: Spatiotemporal Field Generation Based on Hybrid Mamba-Transformer with Physics-informed Fine-tuning domain ★★★

cs.LG updates on arXiv.org

リークReLU二層ニューラルネットワークにおける勾配降下法の方向性収束と良性過学習

本論文は、勾配降下法で学習する固定幅リークReLU二層ニューラルネットワーク分類器における良性過学習の十分条件を提供する。方向性収束と分類誤差界を確立し、新たな相転移を発見した。結果は混合データに適用され、従来の直交データ設定よりも広範なシナリオをカバーする。良性過学習が証明されずに失敗するケースも特徴づけ、リークReLU二層ニューラルネットワークにおける良性過学習のより完全な理解を提供する。

Action: 機械学習モデルの過学習と収束挙動に関する理論的条件を調査し、実際のモデル開発におけるこれらの知見の応用可能性を検討する。

Original: Directional Convergence, Benign Overfitting of Gradient Descent in leaky ReLU two-layer Neural Networks domain ★★

cs.LG updates on arXiv.org

転移可能性の転移について：サイズ汎化のための理論を目指して

・可変サイズの入力を扱えるモデル（グラフ、集合、点群など）の重要性について論じています。・次元間の転移可能性を、リミット空間における連続性と関連付ける一般化フレームワークを提案します。・提案フレームワークの既存アーキテクチャへの適用、設計原則の提示、および数値実験による検証を行っています。

Action: 提案されているサイズ汎化可能なモデルの転移可能性フレームワークと設計原則を、現在の機械学習プロジェクトに適用する方法を調査する。

Original: On Transferring Transferability: Towards a Theory for Size Generalization domain ★★★

cs.LG updates on arXiv.org

LLMは構造的に推論できるか？データ構造を介したベンチマーキング

LLMのアルゴリズム的推論能力、特に構造的推論（順序、階層、接続性などの関係の理解と操作）を評価するためのベンチマークDSR-Benchを提案。 DSR-Benchは20のデータ構造、35の操作、4,140のインスタンスから構成され、LLMの限界を明らかにする。最先端LLMの評価では、挑戦的なインスタンスで最高性能でも0.46/1にとどまり、空間データやコード推論などでも弱点が見られた。

Action: LLMの構造的推論能力における限界を理解し、DSR-Benchなどのベンチマークを活用して、AIモデルのアルゴリズム的推論能力の向上策を検討する。

Original: Can LLMs Reason Structurally? Benchmarking via the Lens of Data Structures domain ★★★

cs.LG updates on arXiv.org

遅延ロバストなポリシー最適化のための信念ベースオフライン強化学習

オフライン強化学習(RL)エージェントが、シミュレーションと現実環境のギャップ（特に遅延）に対処するための新しいフレームワーク「DT-CORL」を提案。 DT-CORLは、学習中に遅延観測なしでも、Transformerベースの信念予測器を用いて遅延に強い行動を生成し、サンプル効率も向上させる。 D4RLベンチマークでの実験により、遅延環境下での性能が向上し、シム・ツー・リアル間の遅延ギャップを縮小することを確認。

Action: DT-CORLフレームワークの技術詳細を調査し、既存のオフラインRLシステムへの適用可能性を検討する。

Original: Belief-Based Offline Reinforcement Learning for Delay-Robust Policy Optimization domain ★★★

cs.LG updates on arXiv.org

継続学習の前に適応する

継続学習（CL）における、事前学習済みモデル（PTM）の可塑性と安定性のバランス問題に対し、各タスク学習前に埋め込みを整列させる「ACL」フレームワークを提案。 ACLは、安定性と可塑性の望ましいバランスを理論的・実証的に示し、CLパフォーマンスを大幅に向上させる。コードはGitHub（https://github.com/byyx666/ACL_code）で公開されている。

Action: ACLのGitHubリポジトリ（https://github.com/byyx666/ACL_code）を確認し、コードをクローンして、提案されている適応メカニズムをローカルで試す。

Original: Adapt before Continual Learning domain ★★★

cs.LG updates on arXiv.org

身体活動のための個別化行動変容メッセージング：コンテキストバンディットと大規模言語モデルの統合

コンテキストバンディット（cMAB）と大規模言語モデル（LLM）を組み合わせ、身体活動のための個別化されたメッセージを生成する。ハイブリッドアプローチでは、cMABが介入タイプを選択し、LLMが動的にメッセージ内容をパーソナライズする。実験により、cMABxLLMはメッセージの受容性を維持しつつ、トークン使用量を削減し、介入配信の偏りを改善することが示された。

Action: 他のドメインで、同様のハイブリッドcMABxLLMシステムをパーソナライズされたコンテンツ配信のために実装することを検討する。

Original: Tailored Behavior-Change Messaging for Physical Activity: Integrating Contextual Bandits and Large Language Models domain ★★

cs.LG updates on arXiv.org

Uni-DPO: LLMの動的選好最適化のための統一パラダイム

DPOはRLHFでシンプルかつ効率的だが、データ品質や学習難易度を考慮しないため非効率。 Uni-DPOは、選好ペアの品質とモデルの学習進捗を動的に再重み付けすることで、データ利用効率を向上させる。テキスト、数学、マルチモーダルタスクで、Gemma-2-9B-ITがClaude 3 Opusを上回るなど、優れた性能と汎用性を示す。

Action: Uni-DPOの論文を読み、Gemma-2-9B-ITや他のモデルでの実装方法や性能向上について調査する。

Original: Uni-DPO: A Unified Paradigm for Dynamic Preference Optimization of LLMs domain ★★★

cs.LG updates on arXiv.org

少しずつ：ランク1連想記憶エキスパートの逐次混合による継続的学習

大規模事前学習モデルにおける継続的学習（CL）では、タスク干渉や破滅的忘却が課題となる。既存のLoRAベースMoE手法は新しいアダプターを追加・固定するが、冗長性、干渉、あいまいなルーティングに悩まされる。本研究では、ランク1アダプターを原子的なメモリエキスパートと見なし、重み行列を線形連想記憶として扱うMoRAM（Mixture of Rank-1 Associative Memory）を提案する。 MoRAMは明示的なルーターを排除し、自己活性化メカニズムによるコンテンツアドレス可能な検索を実現。CLIPとLLMでの実験により、既存手法を大幅に上回る性能を示した。

Action: MoRAMの提案手法を既存の大規模モデルに適用し、継続的学習タスクにおける忘却防止と性能向上の効果を検証する。

Original: Little By Little: Continual Learning via Incremental Mixture of Rank-1 Associative Memory Experts domain ★★★

cs.LG updates on arXiv.org

不確実性駆動エンベディング畳み込み

現在のNLPにおけるテキスト埋め込みモデルとそのアンサンブル手法が、モデル固有の不確実性を考慮できない限界を指摘。不確実性駆動エンベディング畳み込み（UEC）を提案。決定論的埋め込みを確率論的に変換し、不確実性に基づいて適応的な係数計算と類似度スコアリングを行う。多様なベンチマークでの広範な実験により、UECが不確実性モデリングを活用することで、性能とロバスト性を一貫して向上させることが実証された。

Action: NLPパイプラインにUECの原則を組み込むことを検討し、特に高い信頼性を必要とするタスクにおけるモデルのロバスト性を向上させる。

Original: Uncertainty-driven Embedding Convolution domain ★★

cs.LG updates on arXiv.org

深層ネットワークの学習可能性：永続的サブスペース直交性によるアプローチ

ニューラルネットワークの学習における勾配消失・爆発問題は、深層化の障壁となっていた。本研究では、ネットワークヤコビアンを制御し、勾配ノルムを維持するための直交性または永続的サブスペース直交性という概念を提案する。この条件により、非常に深いネットワークの学習が可能になることを、広範な実験で実証した。

Action: 提案された永続的サブスペース直交性の条件を、既存のニューラルネットワークアーキテクチャに適用し、勾配フローへの影響を実験的に評価する。

Original: Deep Network Trainability via Persistent Subspace Orthogonality domain ★★★

cs.LG updates on arXiv.org

適合予測器におけるアンラーニングのための新しいパラダイム：コンフォーマル・アンラーニング

既存の適合予測器のアンラーニング手法における「偽の適合アンラーニング」といった課題に対処するため、再学習に依存せず、有限サンプルでの不確実性を考慮した新たなパラダイムと実用的な評価指標・アルゴリズムを提案。保持データには高いカバレッジ、忘却データには高いミス・カバレッジを要求する形式化を行い、ビジョン・テキストベンチマークで有用性を維持しつつ標的情報を効果的に削除できることを実証。

Action: 提案されたコンフォーマル・アンラーニングアルゴリズムの概念を理解し、プライバシー保護が求められるAIシステムへの応用可能性と実装方法について調査する。

Original: Conformal Unlearning: A New Paradigm for Unlearning in Conformal Predictors domain ★★

cs.LG updates on arXiv.org

Shuffle-R1: マルチモーダル大規模言語モデルのためのデータ中心型動的シャッフルによる効率的なRLフレームワーク

マルチモーダル大規模言語モデル（MLLM）の推論能力向上に、強化学習（RL）が有効であることが示されています。既存のRLパイプラインは、アドバンテージの崩壊やロールアウトの沈黙といった訓練非効率性の問題に直面していました。新提案のShuffle-R1フレームワークは、軌道サンプリングとバッチ構成を動的に再構築することで、RLファインチューニングの効率を向上させます。

Action: Shuffle-R1フレームワークをMLLMタスクに適用し、その効率性を評価する実験を計画・実行する。

Original: Shuffle-R1: Efficient RL framework for Multimodal Large Language Models via Data-centric Dynamic Shuffle domain ★★★

cs.LG updates on arXiv.org

MOTGNN: マルチオミクス疾患分類のための解釈可能なグラフニューラルネットワーク

・提案手法MOTGNNは、XGBoostとGNNを組み合わせ、マルチオミクスデータを効果的に統合し、疾患分類の精度を向上させます。・既存手法と比較して、精度、ROC-AUC、F1スコアで5-10%の性能向上を達成し、クラス不均衡にも強いロバスト性を示します。・計算効率が高く、トップランクのバイオマーカーや各オミクスモダリティの相対的寄与を明らかにする解釈可能性も提供します。

Action: MOTGNNの論文を読み、XGBoostとGNNを用いたマルチオミクスデータ統合と疾患分類のパイプラインをローカル環境で再現または実装することを検討する。

Original: MOTGNN: Interpretable Graph Neural Networks for Multi-Omics Disease Classification domain ★★★

cs.LG updates on arXiv.org

大規模言語モデル（LLM）によるセマンティック拡張時系列予測

時系列予測におけるLLMの活用が進む中、言語知識と時系列パターンの間のモダリティギャップが課題となっている。提案手法SE-LLMは、時系列の周期性や異常性をセマンティック空間に埋め込み、LLMの解釈性を高めることで予測性能を向上させる。 LLMをフリーズし、自己注意機構にモジュールを導入することで、計算コストを削減しつつ長・短期間の依存関係を効果的に捉える。

Action: 提案されたSE-LLMを実験的に導入し、既存の時系列予測モデルとの性能比較検証を行う。

Original: Semantic-Enhanced Time-Series Forecasting via Large Language Models domain ★★

cs.LG updates on arXiv.org

深層マルチタスク学習によるエネルギー注入識別を可能にする分解

BTMエネルギー源（太陽光、バッテリー）の普及が、メーターデータのみに依存する従来のNILM手法の性能を低下させている。この課題に対し、Transformerベースの深層マルチタスク学習フレームワーク「DualNILM」を提案。これにより、家電の状態認識とエネルギー注入識別を同時に高精度で行う。評価実験でDualNILMは両タスクで優れた性能を示し、再生可能エネルギー普及下でのエネルギー分解に有効。関連データセットは公開されている。

Action: PV-Augmented-NILM-Datasetsリポジトリを調査し、提案されたDualNILMフレームワークの適用可能性を検討する。

Original: Energy Injection Identification enabled Disaggregation with Deep Multi-Task Learning domain ★★★

cs.LG updates on arXiv.org

Transformerの注意出力における次元崩壊：スパース辞書学習への挑戦

Transformerの注意メカニズムは低次元サブスペースに限定されるが、MLP出力は高次元を維持する。この次元の不一致が、スパース自動エンコーダー（SAE）における「デッドフィーチャー問題」の主要因である。サブスペース制約付き訓練法により、SAEのデッドフィーチャーを大幅に削減し、LLMのスパース辞書学習を改善できる。

Action: Transformerの注意出力における低次元構造を考慮したサブスペース制約付き訓練法を、スパース自動エンコーダー（SAE）の実装に適用し、デッドフィーチャーの問題を軽減する。

Original: Dimensional Collapse in Transformer Attention Outputs: A Challenge for Sparse Dictionary Learning domain ★★★

cs.LG updates on arXiv.org

検証可能な報酬付き強化学習における多様性崩壊緩和の鍵：分岐項の選択

LLMのRLVRファインチューニングでは、単一試行精度向上に対し、複数試行時の性能低下や破滅的忘却が頻繁に発生する。標準的なRLVR目的関数（後退KLダイバージェンスまたは ausencia）は知識保持メカニズムを欠き、後退KLは性能低下を加速し、 ausenciaでは多様性の維持ができない。提案手法DPH-RLは、マス・カバレッジf-ダイバージェンス（フォワードKL、JSダイバージェンス）をリハーサル機構として利用し、広範な解の網羅性を維持することで、性能向上と効率化を実現する。

Action: 強化学習におけるダイバージェンス項の役割とDPH-RLの概念を調査し、LLMファインチューニングへの応用可能性を検討する。

Original: The Choice of Divergence: A Neglected Key to Mitigating Diversity Collapse in Reinforcement Learning with Verifiable Reward domain ★★★

cs.LG updates on arXiv.org

ButterflyQuant: 学習可能な直交バタフライ変換による超低ビットLLM量子化

LLMのメモリフットプリント削減のため、超低ビット（2ビット）量子化における性能低下を解決する「ButterflyQuant」を提案。固定されたアダマール変換の代わりに、学習可能なバタフライ変換を用いることで、層ごとの外れ値パターンに適応し、量子化性能を向上させる。この手法は、勾配ベースの学習を可能にし、効率的な計算（O(n log n)）と高速な収束を実現する。

Action: ButterflyQuantの学習可能バタフライ変換によるLLM量子化手法を調査し、既存モデルへの適用可能性を評価する。

Original: ButterflyQuant: Ultra-low-bit LLM Quantization through Learnable Orthogonal Butterfly Transforms domain ★★★

cs.LG updates on arXiv.org

ランダム特徴量（およびそれ以降）のためのデータ再構成の法則

深層学習モデルは訓練データを記憶する傾向があり、特にパラメータ数 p がサンプル数 n より多い場合に顕著です。本研究では、この記憶をデータ再構成の観点から分析し、p がデータ次元 d とサンプル数 n の積 (dn) を超える場合にデータ再構成が可能であることを示します。ランダム特徴量モデルでは、p が dn を大きく超えるとき、モデルパラメータから訓練データセット全体を復元できる「データ再構成の法則」が明らかになりました。

Action: モデルパラメータからの訓練データ再構成の可能性について、プライバシーやセキュリティへの影響を調査する。

Original: A Law of Data Reconstruction for Random Features (and Beyond) domain ★★

cs.LG updates on arXiv.org

集約を超えて：異種連合学習におけるクライアントの誘導

異種連合学習（FL）における統計的異質性（クライアント間でデータ分布が異なる）は、特にヘルスケア分野でのプライバシー保護に課題をもたらします。本研究では、中央サーバーがモデル更新の集約だけでなく、新しいタスクやクエリを最適なクライアントに誘導する新しいパラダイムを提案します。密度比モデルと経験的尤度ベースのフレームワークを導入し、モデル精度とクライアント誘導精度を向上させ、よりインテリジェントで効率的なFLシステムへの道を開きます。

Action: 「FedDRM」プロジェクトのGitHubリポジトリを確認し、異種連合学習におけるクライアント誘導の新しいアプローチの実装と応用可能性を調査する。

Original: Beyond Aggregation: Guiding Clients in Heterogeneous Federated Learning domain ★★★

cs.LG updates on arXiv.org

チェーン・オブ・エンベディングとの対比による、LVLMの言語プライオリティの理解

LVLMは視覚情報を活用しきれず、学習済みの言語パターン（LP）に依存しがちである。「チェーン・オブ・エンベディング」分析により、視覚情報がモデルの挙動に影響を与え始める「視覚統合点（VIP）」を特定した。新たに開発した「総視覚統合（TVI）」推定値が、LPの強度を定量化し、LVLMの言語プライオリティを診断するツールを提供する。

Action: カスタムLVLM実装における言語プライオリティを診断するために、「総視覚統合（TVI）」推定値と「視覚統合点（VIP）」分析を調査・実装することを検討する。

Original: Understanding Language Prior of LVLMs by Contrasting Chain-of-Embedding domain ★★★

cs.LG updates on arXiv.org

ポリシー探索による離散変分オートエンコーダ

変分オートエンコーダ（VAE）における離散潜在変数は、高いビット効率とパラメータ効率の良いマルチモーダル検索を可能にします。従来の離散VAEは近似手法や高分散な勾配フリー手法に依存していましたが、本研究では自然勾配を用いた新しい学習フレームワークを提案します。この手法はImageNetのような高次元データセットにもスケールし、既存手法を上回る再構成性能を示します。

Action: ImageNetのような高次元データセットで、提案された自然勾配を用いた離散VAEの学習フレームワークを実装・評価する。

Original: Discrete Variational Autoencoding via Policy Search domain ★★★

cs.LG updates on arXiv.org

GLASS Flows：フローおよび拡散モデルの整合のための遷移サンプリング

フローマッチングと拡散モデルの推論効率は、報酬整合アルゴリズムで向上するが、効率が課題。多くのアルゴリズムはSDEサンプリングに依存し、ODEサンプリングより非効率。 GLASS Flowsは、'フロー内フロー'モデルをシミュレートし、マルコフ遷移をサンプリングする新パラダイム。再学習不要で、ODEの効率とSDEの確率的進化を両立。大規模テキスト画像生成モデルで、Feynman-Kac Steeringと組み合わせると、性能が向上し、確率的進化と効率のトレードオフを解消する。

Action: テキスト画像生成モデルにおける推論効率と性能向上のため、GLASS Flowsの実装と評価を検討する。

Original: GLASS Flows: Transition Sampling for Alignment of Flow and Diffusion Models domain ★★★

cs.LG updates on arXiv.org

ACT: エージェンティック分類木

AIシステムは、特に高リスクな状況で、透明性、解釈可能性、監査可能性のある決定を生成する必要があります。従来の決定木は構造化データに限定され、LLMは非構造化データに用いられますが、信頼性の保証が難しいという課題があります。 ACT (Agentic Classification Tree)は、自然言語の質問とLLMフィードバックを組み合わせることで、非構造化データに対する決定木の拡張を提案し、透明で解釈可能な意思決定パスを提供します。

Action: LLMを用いた分類タスクにおける意思決定の透明性と解釈可能性を向上させるため、ACT（Agentic Classification Tree）のアプローチを調査し、実装を検討する。

Original: ACT: Agentic Classification Tree domain ★★★

cs.LG updates on arXiv.org

確率的遅延フィードバックを伴うリプシッツバンディット問題

確率的遅延フィードバックを伴うリプシッツバンディット問題を新たに定義し、報酬の観測遅延を考慮したアルゴリズムを提案。境界付きおよび境界なし遅延に対し、それぞれ遅延を考慮したズーミングアルゴリズムと段階的学習戦略を設計。実験により、提案手法が遅延シナリオ下での効率性を示す。

Action: 提案された段階的学習戦略を、推薦システムや広告配信システムにおける遅延フィードバック問題へ応用可能か調査する。

Original: Lipschitz Bandits with Stochastic Delayed Feedback domain ★★

cs.LG updates on arXiv.org

拡散言語モデルのための推論改善：グループ拡散方策最適化を通じて

拡散言語モデル（DLM）は、 autoregressive LLM の代替として柔軟性を持つが、尤度の計算が困難なため、RLファインチューニングに課題がある。本論文では、ELBO推定における分散を低減するために、決定論的積分近似を利用したDLM向けの新RLアルゴリズム「Group Diffusion Policy Optimization（GDPO）」を提案する。 GDPOは、数式、推論、コーディングベンチマークにおいて、既存手法（diffu-GRPOなど）を上回る一貫した性能向上を達成する。

Action: GDPOアルゴリズムを拡散言語モデル（DLM）の推論能力向上に活用する方法を調査・実装する。

Original: Improving Reasoning for Diffusion Language Models via Group Diffusion Policy Optimization domain ★★★

cs.LG updates on arXiv.org

プログラム学習におけるERMのためのLLM事前知識

既存のプログラム学習手法（ERM、勾配ベース）は、サンプル効率と計算効率のトレードオフを抱えています。提案手法LLM-PVは、LLMの事前知識を利用して、網羅的な探索や大量のサンプルなしにERMスタイルのプログラム選択を可能にします。アルゴリズムタスクにおいて、LLM-PVは少量のデータから正確なルールを復元し、従来の機械学習モデルよりも優れた汎化性能を示しました。

Action: 提案手法`LLM-PV`のアルゴリズムと、公開されているコード（GitHub: DLFundamentals/LLM_PV）による実装の詳細を調査する。

Original: LLM Priors for ERM over Programs domain ★★

cs.LG updates on arXiv.org

安全性フィルタリング下での証明可能な最適強化学習

強化学習における安全性の課題に対処するため、本研究では、許容範囲の広い安全フィルタを用いることで、性能を損なわずに最適化された強化学習が可能であることを証明しました。 SC-MDPとフィルタリングされたMDPを定義し、フィルタリングされたMDPでの学習が安全かつ収束し、その最適政策が最良の安全政策と同等の性能を達成することを示しています。これにより、安全性と性能最適化を分離し、安全な強化学習のためのシンプルで原則的なアプローチを提供します。

Action: 強化学習における安全性と性能のトレードオフに関する理論的進展を調査し、Safety Gymnasiumでの実験結果を参考に、開発中のシステムに安全フィルタリングを導入する際の考慮事項をまとめる。

Original: Provably Optimal Reinforcement Learning under Safety Filtering domain ★★★

cs.LG updates on arXiv.org

深層学習における多くの汎化尺度の壊れやすさに関する考察

深層学習の学習済みモデルに対する汎化尺度は、学習率の調整やSGDバリアントの切り替えといった微細な学習変更によって、値、トレンド、スケーリング動作が大きく変動する「壊れやすさ」を持つ。 PAC-Bayes起源尺度は、多くの汎化尺度よりもハイパーパラメータ調整に強いが、データ複雑性の違いを学習曲線で捉えられないという脆弱性がある。新しい汎化尺度の開発者は、これらの壊れやすさ（特にデータ複雑性との関連）を明示的に監査することが推奨される。

Action: 深層学習の汎化尺度開発者は、学習率の微調整やハイパーパラメータの変更に対して、提案する尺度の値がどの程度影響を受けるか（脆弱性）を詳細に評価し、結果を公開することが推奨される。

Original: Position: Many generalization measures for deep learning are fragile domain ★★

cs.LG updates on arXiv.org

時間経過に伴う処置効果推定のためのオーバーラップ重み付け直交メタ学習器

時間経過とともに処置効果を推定する際の、処置の重複不足による推定値のばらつき問題を解決する。高確率で介入的処置系列を受け取る領域をターゲットとする新しいオーバーラップ重み付け直交（WO）メタ学習器を導入し、信頼性の高い処置効果推定を実現する。このWO学習器はNeyman-直交性を持ち、モデル非依存であり、実験でその有効性が示されている。

Action: 特定のドメイン（例: 医療、マーケティング）における因果推論タスクへのWOメタ学習器の応用を調査する。

Original: Overlap-weighted orthogonal meta-learner for treatment effect estimation over time domain ★★★

cs.LG updates on arXiv.org

SeeDNorm: 自己再スケール動的正規化

既存のRMSNormは入力ノルム情報を破棄し、固定のスケーリング係数ではデータ変動やゼロショットシナリオへの対応が不十分。 SeeDNormは、動的にスケーリング係数を調整し、入力ノルム情報を保持することで、データ依存の自己再スケール動的正規化を実現。最小限のパラメータと無視できる効率影響で、RMSNormやLayerNormなどの既存手法を上回る性能を、多様なタスクで実証。

Action: SeeDNormの現在の深層学習プロジェクトへの統合を調査し、その性能向上効果を評価する。

Original: SeeDNorm: Self-Rescaled Dynamic Normalization domain ★★★

cs.LG updates on arXiv.org

ハミルトニアン力学を用いたグラフニューラルシミュレーターにおける長距離相互作用の改善

グラフニューラルシミュレーター(GNS)における長距離相互作用の課題と誤差蓄積に対処するため、ハミルトニアン力学に基づく情報保存型GNS (IGNS) を提案。 IGNSは、情報保存、ポートハミルトニアンシステム、ウォームアップフェーズ、幾何学的エンコーディング、PDEマッチングのための多段階訓練目標を導入。提案手法は、長距離依存性や外部強制シナリオを対象とした新しいベンチマークで、既存のGNSを上回る精度と安定性を実証。

Action: IGNSの実装方法や、ハミルトニアン力学のGNNへの応用可能性を調査する。

Original: Improving Long-Range Interactions in Graph Neural Simulators via Hamiltonian Dynamics domain ★★★

cs.LG updates on arXiv.org

ゲーム理論的強化学習によるキスティング数の発見

「キスティング数問題」は1694年から続く幾何学、数論、情報理論における未解決問題ですが、AI（強化学習システムPackingStar）を用いて新手法が開発されました。この手法は、問題を2プレイヤーの行列補完ゲームとしてモデル化し、探索空間の次元爆発を克服して、25次元から31次元で記録を更新し、6000以上の新構造を発見しました。 AIによる極限スケールの強化学習が、人間の直感を超える高次元空間の探索を可能にし、幾何学研究に新たな道を開くことを示しています。

Action: AI（強化学習）を用いた高次元空間探索の事例として、PackingStarのゲーム理論的アプローチと学習システムの実装を調査し、自身のプロジェクトにおける応用可能性を検討する。

Original: Finding Kissing Numbers with Game-theoretic Reinforcement Learning domain ★★★

cs.LG updates on arXiv.org

KernelBand: LLMベースのカーネル最適化をハードウェア認識型マルチアームドバンディットで誘導する

LLMサービングに不可欠な高性能GPUカーネル最適化のボトルネックを解消するため、KernelBandフレームワークを提案。ハードウェア認識型プルーニングとトレース駆動クラスタリングを組み合わせたマルチアームドバンディット(MAB)問題としてカーネル最適化を定式化。実験では、既存手法を大幅に上回る性能向上（平均33%超）を実証。

Action: LLMによるGPUカーネル最適化手法「KernelBand」を調査し、自身のLLM開発ワークフローへの適用可能性を検討する。

Original: KernelBand: Steering LLM-based Kernel Optimization via Hardware-Aware Multi-Armed Bandits domain ★★★

cs.LG updates on arXiv.org

Orion-Bix: 表形式データにおけるインコンテキスト学習のための二軸注意機構

「Orion-Bix」は、表形式データ向けの新しい基盤モデルで、バイアクシャルアテンションとメタ学習されたインコンテキスト推論を組み合わせ、数ショット学習を実現します。このモデルは、局所的および大局的な依存関係を効率的に捉えるための多様な注意機構（グループ化、階層化、関係性など）を備えています。公表されているベンチマークにおいて、既存の勾配ブースティング手法を上回り、最先端の表形式基盤モデルとも競合する性能を示しています。

Action: scikit-learn互換のOrion-BixモデルをGitHubから入手し、表形式データへの適用可能性を評価する。

Original: Orion-Bix: Bi-Axial Attention for Tabular In-Context Learning domain ★★★

cs.LG updates on arXiv.org

心臓電気生理学シミュレーションにおける幾何学に依存しないオペレーター学習のための統一フレームワーク

不規則な幾何学形状に対するニューラルオペレーター学習の課題を解決するため、固有座標空間を用いた幾何学に依存しない統一フレームワークを提案。このフレームワークは、メッシュの離散化や幾何学的変動からオペレーター学習を分離し、複雑な解剖学的構造を持つ心臓電気生理学シミュレーションで有効性を示した。心臓電気生理学だけでなく、心臓生体力学など他の物理システムへの応用可能性も示唆されており、異種幾何学上でのニューラルオペレーター学習の汎用的なアプローチとなる。

Action: 幾何学に依存しないオペレーター学習のための固有座標空間表現の概念を調査し、関連するオープンソースライブラリや実装例を特定する。

Original: A unified framework for geometry-independent operator learning in cardiac electrophysiology simulations domain ★★

cs.LG updates on arXiv.org

拡散モデルの汎化は、バランスの取れた表現空間によって生じる

拡散モデルは過学習により訓練データを記憶する可能性があり、記憶と汎化の問題が生じます。汎化は、生のサンプルを格納するのではなく、局所的なデータ統計を捉え、バランスの取れた表現を学習することで実現されます。本研究では、記憶の検出方法と、表現のステアリングによる精密制御のための訓練不要な編集手法を提案しています。

Action: 提案されている記憶検出方法および表現ステアリングによる生成制御手法を調査・実装することを検討する。

Original: Generalization of Diffusion Models Arises with a Balanced Representation Space domain ★★★

cs.LG updates on arXiv.org

EvoXplain：機械学習モデルは予測では一致しても、その理由では一致しない場合 -- トレーニング実行間でのメカニズム的多様性の測定

機械学習モデルの予測精度は高いが、その説明（なぜその予測に至ったか）がトレーニング実行ごとに安定しているとは限らない。 EvoXplainフレームワークは、単一モデルではなく、トレーニングパイプライン全体での説明の安定性を測定し、複数の予測メカニズムが存在するかどうかを可視化・定量化する。高精度でも、モデルが異なる理由で同じ結果に至る可能性があり、EvoXplainは単一インスタンスの説明が隠蔽する「複数の妥当な予測メカニズム」の存在を明らかにする。

Action: トレーニングパイプライン全体でモデルの説明の安定性を評価し、複数の予測メカニズムが存在する可能性を考慮して、モデルの解釈可能性を向上させるためのEvoXplainのような診断フレームワークの導入を検討する。

Original: EvoXplain: When Machine Learning Models Agree on Predictions but Disagree on Why -- Measuring Mechanistic Multiplicity Across Training Runs domain ★★

cs.LG updates on arXiv.org

Gemini向け本番対応プローブの構築

既存のプローブは長文コンテキストへの汎化に課題があり、Geminiのような最先端モデルの誤用対策に限界があった。新規プローブアーキテクチャの提案、多様な分布での学習、プロンプト型分類器との組み合わせにより、長文コンテキストへの対応と頑健性を向上させた。これらの成果はGeminiへの導入に成功し、AI安全研究の自動化（AlphaEvolve利用）にも早期の好結果が見られた。

Action: Gemini向けに提案された、長文コンテキストへの汎化能力を持つ新しいプローブアーキテクチャを調査し、その実装と応用可能性を検討する。

Original: Building Production-Ready Probes For Gemini domain ★★★

cs.LG updates on arXiv.org

未知の条件に対するOOD一般化のための、混合条件付きベースを用いた最短経路フローマッチング

条件付き生成モデルは、未知の条件への汎化（OOD一般化）が課題である。本研究では、ベース分布とフロー場を条件に依存させるSP-FM（最短経路フローマッチング）フレームワークを提案し、混合条件付きベースにより適応性を向上させる。単一細胞トランスクリプトミクスや創薬スクリーニングなどの分野で、OOD一般化能力と堅牢性を実証した。

Action: 提案されたSP-FMフレームワークの概念を理解し、自身の条件付き生成モデルタスクにおけるOOD一般化能力向上の可能性を調査・実装する。

Original: Shortest-Path Flow Matching with Mixture-Conditioned Bases for OOD Generalization to Unseen Conditions domain ★★★

cs.LG updates on arXiv.org

モデル変更下における、証明可能なロバストなベイズ反実仮想説明

現在のカウンターファクチュアル説明（CE）は、モデル更新時に信頼性が低下する問題があります。 PSCE（Probabilistically Safe CEs）は、高予測信頼性（$\delta$-safe）と低予測分散（$\epsilon$-robust）を両立し、モデル変更下での確率的保証を提供します。 PSCEは、実証実験により、既存手法よりも妥当性、識別性、頑健性に優れたカウンターファクチュアル説明を生成することが示されています。

Action: モデル更新が頻繁に行われるMLシステムにおいて、既存のカウンターファクチュアル説明の信頼性低下に対処するため、PSCE（Probabilistically Safe CEs）の概念を学習し、説明生成パイプラインへの統合可能性を検討する。

Original: Provably Robust Bayesian Counterfactual Explanations under Model Changes domain ★★★

cs.LG updates on arXiv.org

ヘビーテイル分布と敵対的摂動下における、線形に近いサンプル複雑性を持つ扱いやすいガウシアン位相回復

本論文は、位相回復問題における、ヘビーテイルノイズや測定・センシングベクトルの敵対的破損に対する頑健性を向上させるアルゴリズムを提案する。ロバスト主成分分析(PCA)の最新の進展を活用し、ヘビーテイルノイズと敵対的破損が混在する状況下でのロバスト位相回復のための初の多項式時間アルゴリズムを実現した。提案手法は、従来の指数時間アルゴリズムよりも大幅に改善された、線形に近いサンプル複雑性を達成する。

Action: ロバスト位相回復のための新しい多項式時間アルゴリズム（特に、ロバストPCAとの関連性）について調査し、その実装可能性や応用分野を検討する。

Original: Tractable Gaussian Phase Retrieval with Heavy Tails and Adversarial Corruption with Near-Linear Sample Complexity domain ★★★

cs.LG updates on arXiv.org

深層強化学習における自然方策勾配のための逆フィッシャー行列のランク1近似

深層強化学習における自然方策勾配計算の計算コストを削減するため、逆フィッシャー情報行列（FIM）のランク1近似手法を提案。この手法は、完全な逆FIMの計算を回避し、効率的かつスケーラブルな自然方策最適化を実現する。理論的・実験的評価により、標準的な方策勾配法と比較して高速な収束と優れた性能を示すことが確認された。

Action: 深層強化学習の実験において、提案されているランク1近似を用いた自然方策勾配法の実装・評価を検討する。

Original: Rank-1 Approximation of Inverse Fisher for Natural Policy Gradients in Deep Reinforcement Learning domain ★★★

cs.LG updates on arXiv.org

Control Bellman Residual Minimization for Markov Decision Problem の解析

マルコフ決定問題の解法として、動的計画法に代わるベルマン残差最小化法を考察。この手法は効率性やモデルフリー設定への拡張性に課題があるものの、関数近似における安定した収束性などの利点を持つ。本論文では、政策最適化（制御タスク）におけるベルマン残差最小化の基礎的な結果を確立する。

Action: この手法の理論的基盤を理解し、強化学習タスクへの適用可能性を評価する。

Original: Analysis of Control Bellman Residual Minimization for Markov Decision Problem domain ★★

cs.LG updates on arXiv.org

ニューラルネットワーク表現における暗黙的仮説検定と発散の保存

ニューラルネットワークの教師あり学習ダイナミクスを二項仮説検定の観点から分析。学習中に、汎化性能の高いネットワークはKLダイバージェンスの増加を通じてNeyman-Pearson最適決定規則に整合していくことを実証。この発見が、様々なニューラルネットワーククラスに対する学習戦略や正則化手法の説明につながる可能性を議論。

Action: 探索的コーディング: 論文で提案されているNeyman-Pearson最適決定規則やKLダイバージェンスの概念を、PyTorchなどのフレームワークで実装し、既存のモデルの学習ダイナミクスと比較分析する。

Original: Implicit Hypothesis Testing and Divergence Preservation in Neural Network Representations domain ★★★

cs.LG updates on arXiv.org

Transform-Augmented GRPO が Pass@package-lock.json を改善

大規模言語モデル（LLM）は、本質的にパターン学習器であり、GRPOは推論改善を目指すものの、多様性崩壊と勾配減衰という二つの問題を引き起こす。 TA-GRPO（Transform-Augmented GRPO）は、質問の多様な変種を生成し、報酬をプールすることで、これらの問題を解決し、汎化性能を向上させる。数学的推論ベンチマークでの実験では、TA-GRPOがAMC12、AIME24、GPQA-Diamondにおいて、最大9.84ポイントの性能向上を示した。

Action: TA-GRPOの理論的根拠と実験結果を詳細に調査し、LLMの推論能力向上のための実装・応用可能性を検討する。

Original: Transform-Augmented GRPO Improves Pass@k domain ★★★

cs.LG updates on arXiv.org

TABES: マスクド拡散モデルのための軌道認識エントロピー後方ステアリング

マスクド拡散モデル(MDM)は、並列デコーディングと双方向コンテキスト利用を提供する有望な非自己回帰パラダイムだが、単純な信頼度ベースのヒューリスティクスは初期の誤りがグローバルな不整合に連鎖する「軌道ロックイン」を引き起こす。本研究では、勾配誘導推論フレームワークである「Backward-on-Entropy (BoE) Steering」を提案し、単一の後方パスで無限ホライズン先読みを近似し、トークン影響スコア(TIS)により不確実性を最小化する。 BoEは、マスキング目的の構造を活用するスパースな「ActiveQueryAttention」によりスケーラビリティを確保し、既存手法より優れたパレートフロンティアを達成する。コードは公開予定。

Action: コード公開を追跡し、実装を検証する。

Original: TABES: Trajectory-Aware Backward-on-Entropy Steering for Masked Diffusion Models domain ★★★

cs.LG updates on arXiv.org

長期タンパク質ダイナミクス向けスケーラブルな時空間SE(3)拡散モデル

MDシミュレーションは計算コストが高く、タンパク質ダイナミクスの研究を制限しています。既存の生成モデルは、長期的生成においてアーキテクチャ上の制約や誤差蓄積に苦慮しています。 STAR-MD（Spatio-Temporal Autoregressive Rollout for Molecular Dynamics）は、時空間アテンションを持つ因果的拡散トランスフォーマーを採用し、マイクロ秒スケールのタンパク質軌道を効率的かつスケーラブルに生成するSE(3)等変拡散モデルです。 STAR-MDは、過去のモデルを大幅に凌駕する性能を示し、生物学的に関連する時間スケールでの堅牢なダイナミクスシミュレーションを可能にします。

Action: STAR-MDの発表論文を調査し、タンパク質ダイナミクスシミュレーションにおける時空間アテンション機構の有効性を評価する。

Original: Scalable Spatio-Temporal SE(3) Diffusion for Long-Horizon Protein Dynamics domain ★★★

cs.LG updates on arXiv.org

テキストフィードバックによる強化学習能力の拡張

LLMの強化学習（RL）におけるスカラー報酬の限界を克服するため、より豊かな「テキストフィードバック」を教師信号として活用する研究。フィードバックを学習中に利用するが推論時には使わない「RL from Text Feedback (RLTF)」を提案。自己蒸留（RLTF-SD）とフィードバックモデリング（RLTF-FM）の2手法を提示。推論パズル、数学、創作執筆タスクで、提案手法が既存手法を上回り、リッチな教師信号の可能性を示唆。

Action: RLTF-SDおよびRLTF-FM手法を調査し、LLMのファインチューニングへの適用可能性を検討する。

Original: Expanding the Capabilities of Reinforcement Learning via Text Feedback domain ★★★

cs.LG updates on arXiv.org

パラメータ空間ノイズによる探索学習：検証可能報酬を用いた強化学習におけるパラメータ空間ノイズの詳細分析

RLVRにおける探索限界がLLMの推論能力向上を妨げている。 PSN-RLVRは、パラメータ空間ノイズで軌跡レベルの探索を促進し、長期的な思考の整合性を維持する。 PSN-GRPOは数学的推論ベンチマークで性能を向上させ、既存手法を上回った。

Action: PSN-RLVR手法（特にPSN-GRPO）をLLMの推論能力向上に適用する可能性を調査・実装する。

Original: Learning to Explore with Parameter-Space Noise: A Deep Dive into Parameter-Space Noise for Reinforcement Learning with Verifiable Rewards domain ★★★

cs.LG updates on arXiv.org

分子理解のためのグラフLLMアラインメントにおけるエントロピー誘導動的トークン

既存のグラフ-LLM連携手法は、固定長の静的トークンを使用するため、分子グラフの立体化学や部分構造の理解に限界がある。本研究では、エントロピー誘導動的トークンを用いるEDT-Formerを提案し、情報量の多い分子パッチに整合したトークンを生成することで、局所的・全体的な構造的特徴を保持する。 EDT-Formerは、LLMバックボーンを微調整せずに、凍結されたグラフエンコーダーとLLMのアラインメントを可能にし、効率的なファインチューニングと分子理解タスクにおける最先端の結果を達成する。

Action: 分子グラフ理解のためのEDT-Formerモデルのアーキテクチャと、グラフエンコーダーとLLMの効率的なアラインメント手法について調査し、将来的なデータ分析パイプラインへの応用可能性を評価する。

Original: Entropy-Guided Dynamic Tokens for Graph-LLM Alignment in Molecular Understanding domain ★★

cs.LG updates on arXiv.org

ラベルホライゾンパラドックス：金融予測における教師信号ターゲットの再考

金融予測における深層学習では、学習ラベルが推論ターゲットと一致することが一般的だが、本研究はこの前提に異議を唱える。「ラベルホライゾンパラドックス」は、市場の動向と信号-ノイズのトレードオフに依存し、最適な教師信号は予測目標から逸脱することが多いと提唱する。最適なプロキシラベルを見つけるための二重レベル最適化フレームワークが提案され、大規模金融データセットでの実験で大幅な改善が示されている。

Action: 金融予測のための提案された二重レベル最適化フレームワークを調査し、代替の機械学習タスクへの実装を検討する。

Original: The Label Horizon Paradox: Rethinking Supervision Targets in Financial Forecasting domain ★★★

cs.LG updates on arXiv.org

補間学習システムにおける汎化のための関数空間安定性境界

学習システムにおける汎化のメカニズムを、関数空間上の軌跡としてモデル化し、単一サンプル摂動への感度を測定する。収縮伝播条件と安定性証明を提案し、証明の成長が汎化能力の違いを予測することを示す。補間学習システムでは、安定性が常に汎化を説明するわけではないことを理論的・実験的に証明する。

Action: 提案された安定性証明を既存の機械学習モデルに適用し、汎化能力の違いを理解するための調査を行う。

Original: A Function-Space Stability Boundary for Generalization in Interpolating Learning Systems domain ★★★

cs.LG updates on arXiv.org

ライブストリーミングプラットフォームにおけるリスク評価のためのアクション認識カプセル複数インスタンス学習：ライブか嘘か

ライブストリーミングにおけるリスク評価は、巧妙に隠蔽された悪意のある協調行動の検知が困難であり、弱監視下での課題となっています。本研究では、複数インスタンス学習（MIL）を応用し、「ユーザー・タイムスロットカプセル」をインスタンスとするアクション認識カプセルMILフレームワーク（AC-MIL）を提案しました。 AC-MILは、個々の行動と集団の協調パターンを捉え、大規模データセットで最先端の性能を示し、行動セグメントレベルでの解釈可能性も提供します。

Action: AC-MILプロジェクトページ(https://qiaoyran.github.io/AC-MIL/)を参照し、ライブストリーミングでのリスク評価における応用可能性や、類似の複数インスタンス学習（MIL）およびカプセルネットワーク技術の導入について調査する。

Original: Live or Lie: Action-Aware Capsule Multiple Instance Learning for Risk Assessment in Live Streaming Platforms domain ★★★

cs.LG updates on arXiv.org

TensorGalerkinを用いた偏微分方程式(PDE)の学習、解法、最適化：効率的な高性能Galerkinアセンブリアルゴリズム

変分構造を持つ偏微分方程式(PDE)の数値解法、最適化、物理情報学習を統合する統一的なアルゴリズムフレームワークを提案。 GPU互換のTensorGalerkinフレームワークにより、線形システムアセンブリ（剛性行列・荷重ベクトル）を高速化し、計算効率と精度を大幅に向上。 PDEソルバー、微分可能な最適化フレームワーク、物理情報オペレーター学習アルゴリズムとして機能し、様々なPDEベンチマークで既存手法を凌駕する効率と精度を実証。

Action: TensorGalerkinフレームワークのアーキテクチャと実装を調査し、関連する数値計算ライブラリやGPUアクセラレーション技術との連携可能性を検討する。

Original: Learning, Solving and Optimizing PDEs with TensorGalerkin: an efficient high-performance Galerkin assembly algorithm domain ★★★

cs.LG updates on arXiv.org

変分推論的投機的デコーディング：トークン尤度からシーケンス受容へのドラフトトレーニングの再考

投機的デコーディングはLLM推論を高速化するが、学習とデコーディングの乖離が存在する。提案手法VSDは、ドラフトパスに対する変分推論を用い、受容確率を最大化する。 VSDは受容長と速度を向上させ、既存手法に対し顕著な改善を示す。

Action: 提案されているVariational Speculative Decoding (VSD)の実装方法や、既存のLLM推論高速化手法（EAGLE-3, ViSpecなど）との性能比較を調査する。

Original: Variational Speculative Decoding: Rethinking Draft Training from Token Likelihood to Sequence Acceptance domain ★★★

cs.LG updates on arXiv.org

非凸行列センシングにおける局所的最小値からの証明可能な脱出：シミュレーテッドリフティングによる決定論的フレームワーク

非凸行列センシングにおける偽の局所的最小値からの脱出という課題に対処します。計算上実行不可能なテンソルリフティングを行わずに、決定論的にこれらの最小値から脱出するための新しい「シミュレーテッド・オラクル・ディレクション（SOD）」メカニズムを提案します。このフレームワークは、局所的最小値からの目的関数値の減少を保証し、一般的な非凸最適化への応用が期待されます。

Action: 提案されたSODメカニズムの非凸最適化問題（特に機械学習モデルの学習）への適用可能性を調査し、既存の最適化手法との比較検討を行う。

Original: Escaping Local Minima Provably in Non-convex Matrix Sensing: A Deterministic Framework via Simulated Lifting domain ★★★

cs.LG updates on arXiv.org

学習の熱力学的理論 Part II: クリティカル・ピリオドの終結と継続学習の失敗

有限時間での学習は本質的に不可逆であり、学習ダイナミクスの複合は適応能力を低下させます。モデルの残存適応能力は、タスク保存方向の対数体積で定義される「互換性のある実効ランク」で定式化されます。破滅的忘却は、再構成能力の不可逆的な喪失に起因し、継続学習の軌道レベル容量限界を確立します。

Action: 継続学習における破滅的忘却を防ぐため、学習ダイナミクスの不可逆性と再構成能力の低下に関する理論的限界を、実際のAIモデル開発や学習戦略にどのように応用できるか調査する。

Original: A Thermodynamic Theory of Learning Part II: Critical Period Closure and Continual Learning Failure domain ★★★

cs.LG updates on arXiv.org

関数空間における分布フリーのロバストな予測・最適化

ニューラルオペレーターモデルはPDEの近似に用いられるが精度保証がないため、誤った設計につながるリスクがある。本研究では、共形予測とロバストな意思決定フレームワークを無限次元関数空間（ソボレフ空間）へ拡張する。これにより、工学設計タスクのロバストな定式化と、その最適設計における劣等性を特徴づける。

Action: 共形予測を無限次元関数空間に拡張する手法を調査し、既存の機械学習パイプラインやエンジニアリング設計ワークフローへの応用可能性を検討する。

Original: Distribution-Free Robust Predict-Then-Optimize in Function Spaces domain ★★★

cs.LG updates on arXiv.org

高次元因果推論のためのニューラルスコアマッチング

高次元データセットでは、従来の因果推論のマッチング手法は次元の呪いのために非現実的である。提案手法「ニューラルスコアマッチング」は、ニューラルネットワークを用いて多変量バランススコアを取得し、高次元因果推論を行う。この手法は、半合成高次元データセットにおいて、他のマッチング手法と比較して同等以上の性能を示した。

Action: 従来の Маchine Learning 手法では不十分な高次元因果推論タスクにおいて、ニューラルスコアマッチングの実装を検討する。Python におけるニューラルネットワークおよび因果推論ライブラリを調査する。

Original: Neural Score Matching for High-Dimensional Causal Inference domain ★★★

cs.LG updates on arXiv.org

血管性事前情報を用いたデュアルチャネル3D UNet 3+による気道樹モデリング

肺気道樹のモデリングは、CT画像を用いた肺疾患診断に不可欠であり、疾患の早期発見や治療に貢献します。本研究では、血管特徴抽出にFrangiフィルタと、医療画像分野で成果を上げているUNet 3+を組み合わせたデュアルチャネル3D UNet 3+を提案します。血管様特徴を事前情報として活用することで、気道樹モデリングの精度向上を目指します。

Action: 提案されているデュアルチャネル3D UNet 3+アーキテクチャを、異なる医療画像セグメンテーションタスク（例：脳腫瘍、網膜血管）に適用し、その有効性を評価する。

Original: Airway Tree Modeling Using Dual-channel 3D UNet 3+ with Vesselness Prior domain ★★★

cs.LG updates on arXiv.org

ペアワイズ学習のための非パラメトリック推定の精密な分析

本研究では、ペアワイズ学習における非パラメトリック推定の汎化性能に焦点を当て、既存研究の制約（凸性、VCクラス、凸損失）を大幅に緩和した。これにより、カーネル法やニューラルネットワークなど、多くの手法への適用可能性が広がり、リプシッツ連続なペアワイズ損失に対するシャープなオラクル不等式を確立した。特に、構造化されたディープReLUニューラルネットワークを用いて真の予測器を近似し、点推定最小二乗回帰のミニマックス下限に一致する超過母集団リスク限界を導出した。

Action: 論文で提案されている、より緩和された仮定下での非パラメトリック推定の一般化結果を、特定のニューラルネットワークアーキテクチャ（例：Transformer）への応用を検討する。

Original: Fine-grained Analysis of Non-parametric Estimation for Pairwise Learning domain ★★★

cs.LG updates on arXiv.org

高次元データ設定におけるシミュレーションベース推論のための拡散事後サンプリング

複雑なシミュレーターを用いる科学分野でのモデルパラメータ推定において、尤度計算が困難な場合にシミュレーションベース推論(SBI)が用いられます。「高次元データ設定」では、複数の独立した観測が事後分布をシャープにし、パラメータ同定可能性を向上させます。本研究では、Langevinダイナミクスを不要にし、より高速かつ安定したサンプリングを実現する新しい拡散事後サンプリングアルゴリズムを提案し、計算神経科学の複雑なモデルに適用しました。

Action: 提案された新しい拡散事後サンプリングアルゴリズムのPython実装を調査し、既存のSBIベンチマークデータセットで性能を評価する。

Original: Diffusion posterior sampling for simulation-based inference in tall data settings domain ★★★

cs.LG updates on arXiv.org

直交、ローレンツ、シンプレクティック対称性を持つテンソル学習

テンソルは多くの科学分野で基本的なデータ構造です。本論文は、直交、ローレンツ、シンプレクティック群の対称性を利用した、テンソル関数のための普遍的に表現力のある同変機械学習アーキテクチャを開発します。材料科学、理論計算機科学、時系列分析の3つの問題で、同変モデルが非同変ベースラインよりも優れた性能を示すことを数値実験で示しています。

Action: テンソル対称性が関連する科学計算や機械学習プロジェクトに、これらの同変テンソル学習アーキテクチャの導入を検討し、モデルの性能向上につなげる。

Original: Tensor learning with orthogonal, Lorentz, and symplectic symmetries domain ★★

cs.LG updates on arXiv.org

行列値力学系のための指数的時間差分法

1. 行列値の進化方程式は多くの応用で発生するが、線形項の剛性（stiffness）により標準的な陽的積分法の実用的利用が困難になる。 2. 指数的時間差分法（ETD）は線形項を正確に扱うことで安定した数値解法を提供し、本研究では行列値進化方程式にETDを拡張した明示的な行列ETD（METD）スキームを導出した。 3. 提案されたMETDスキームは、剛性のあるPDE由来および大規模行列ダイナミクスに効率的で、精度、安定性、効率において競合手法を上回る。

Action: 本研究で提案された行列値力学系のための指数的時間差分法（METD）スキームを、機械学習や制御工学における剛性のあるシステムへの適用可能性について調査し、既存手法との比較検討を行う。

Original: Exponential time differencing for matrix-valued dynamical systems domain ★★

cs.LG updates on arXiv.org

説明可能性と埋め込みの統合：BEEによる偽相関の検出

BEE (Bridging Explainability and Embeddings) フレームワークは、モデルの予測ではなく、重み空間と埋め込みの幾何学を分析することで、偽相関を検出します。ファインチューニングによる表現の摂動を調査し、従来の評価では見逃される偽の特徴や相関を明らかにします。画像、言語、医療分野など多岐にわたるドメインで、モデルの精度を著しく低下させたり危険な誤検出を誘発する偽相関を特定し、信頼性の高い基盤モデル構築に貢献します。

Action: https://github.com/bit-ml/bee にて公開されている BEE フレームワークのソースコードを確認し、重み空間における偽相関の診断方法と、データセット監査および基盤モデルの信頼性向上への応用について理解を深める。

Original: Bridging Explainability and Embeddings: BEE Aware of Spuriousness domain ★★★

cs.LG updates on arXiv.org

LLMにおける推測的デコーディングによるサイドチャネル：推測が秘密を漏洩させる

LLMの推測的デコーディング（生成速度向上のための技術）に、新たなサイドチャネル脆弱性が存在することを明らかにしました。攻撃者は、イテレーションごとのトークン数やパケットサイズを監視することで、ユーザーのクエリを推測し、機密データを漏洩させることが可能です。研究では、高精度でクエリを特定し、データ漏洩を行う能力を示し、パケットパディングなどの防御策を提案しています。

Action: LLMサービス提供者は、推測的デコーディングの実装において、トークン数やパケットサイズ監視による情報漏洩リスクを評価し、パケットパディングやトークン集約などの防御策の導入を検討すべきである。

Original: When Speculation Spills Secrets: Side Channels via Speculative Decoding In LLMs domain ★★

cs.LG updates on arXiv.org

エンド・ツー・エンドの協調的合成データ生成

AI開発におけるデータ不足、特に希少疾患のような複数機関でのデータ共有の必要性に対応するため、エンド・ツー・エンドの協調的合成データ生成フレームワークを提案。既存手法が合成器のトレーニングに限定されるのに対し、本研究ではプライバシー保護の前処理から評価までを統合したエンドツーエンドの枠組みを構築。このフレームワークはセキュアマルチパーティ計算（MPC）プロトコルと組み合わされ、白血病のゲノムデータを用いたプライバシー保護出版のユースケースで評価。

Action: セキュアマルチパーティ計算（MPC）プロトコルを用いたエンド・ツー・エンドの協調的合成データ生成フレームワークの実装可能性や、既存のプライバシー保護データ共有ライブラリとの連携について調査する。

Original: End to End Collaborative Synthetic Data Generation domain ★★★

cs.LG updates on arXiv.org

教師なしバイアス検出ツールを使用したオランダ公共部門のリスクプロファイリングアルゴリズムの監査

プライバシー法により人口統計データが利用できない場合におけるアルゴリズムのバイアス検出を研究。 2012年から2023年にかけて25万人以上の学生を対象に、オランダの大学学生リスクスコアリングアルゴリズムを監査。欧州外移民背景を持つ学生とオランダ/欧州出身学生との間の格差を特定し、バイアス監査のためのオープンソースツールを提供。

Action: 論文で言及されているオープンソースの教師なしバイアス検出ツールを、アルゴリズムによる意思決定を伴う自身のプロジェクトで検討・評価することを推奨します。

Original: Auditing a Dutch Public Sector Risk Profiling Algorithm Using an Unsupervised Bias Detection Tool domain ★★★

cs.LG updates on arXiv.org

EmbBERT: 2MBメモリ未満の注意機構

「EmbBERT」は、ウェアラブルやIoTデバイスのような超低メモリ環境（2MB未満）向けに設計された、効率的なTransformerベースの言語モデルです。このモデルは、コンパクトな埋め込み層、効率化されたフィードフォワードブロック、および注意機構を統合し、大幅に少ないメモリで最先端モデルに匹敵する精度を達成します。 8ビット量子化により781kBまでメモリ使用量を削減可能であり、コードとチェックポイントが公開されており、リソース制約のあるエッジデバイスでの応用が期待されます。

Action: EmbBERTのアーキテクチャとパフォーマンスを調査し、リソース制約のある組み込みシステムへの応用可能性を検討する。

Original: EmbBERT: Attention Under 2 MB Memory domain ★★★

cs.LG updates on arXiv.org

ポリシーを言語化する：LLMの説明のためのフローマッチング生成報酬

強化学習とAIフィードバックを用いて、LLMにエージェントポリシーを自然言語で説明させるためのフレームワークを提案。生成連続正規化フロー (CNF) を用いて報酬を生成し、人間の判断の多様性と確率性を捉え、報酬分布からの逸脱をバウンドさせる。提案手法は、既存手法と比較して、より正確で論理的、かつ実行可能な説明を、低い認知負荷で提供することを示す。

Action: LLMの説明能力向上のための、CNFベースの報酬生成フレームワークの実装可能性を調査する。

Original: Translate Policy to Language: Flow Matching Generated Rewards for LLM Explanations domain ★★★

cs.LG updates on arXiv.org

ネットワーク化されたブラックボックスシステムのための多目的ベイズ最適化：よりグリーンな利益とよりスマートな設計への道

複雑なネットワークシステムにおける多目的最適化（MOO）のための、新しいベイズ最適化アルゴリズム「MOBONS」を紹介します。 MOBONSは、ブラックボックスやグレイボックスモデルに対応し、既存手法では困難な循環依存を持つ一般関数ネットワークを効率的に最適化します。エンジニアリングシステムの設計において、収益性、回復力、持続可能性の向上を目指します。

Action: 複雑なエンジニアリングシステム最適化のためにMOBONSアルゴリズムを調査・実装する。

Original: Multi-Objective Bayesian Optimization for Networked Black-Box Systems: A Path to Greener Profits and Smarter Designs domain ★★

cs.LG updates on arXiv.org

Decentralized Reinforcement Learning for Multi-Agent Multi-Resource Allocation via Dynamic Cluster Agreements

Original: Decentralized Reinforcement Learning for Multi-Agent Multi-Resource Allocation via Dynamic Cluster Agreements domain ★

cs.LG updates on arXiv.org

正確、証明可能、高速な多色断層画像再構成：変分不等式アプローチ

・X線減衰、多色X線源、一般化された測定ノイズを考慮した非線形フォワードモデル下でのCT画像再構成問題に対処。・変分不等式の不動点として推定値を定式化する反復アルゴリズム「EXACT」を開発し、統計的・計算的性能保証を証明。・ファントム画像回復タスクで、既存手法と同等の品質をより少ないX線ビュー、低強度、短時間計算で達成できることを示し、コードをGitHubで公開。

Action: GitHubで公開されているEXACTアルゴリズムのコードを確認し、その実装を調査する。

Original: Accurate, provable and fast polychromatic tomographic reconstruction: A variational inequality approach domain ★★

cs.LG updates on arXiv.org

局所化されたグラフベースニューラルダイナミクスモデルによる地形操作

ロボットによる地形操作のため、グラフベースニューラルダイナミクス（GBND）を活用した学習ベースのアプローチを提案。高次元な地形表現の問題を克服するため、関心領域（RoI）を特定し、局所的なアクティブサブグラフで予測を効率化。提案手法は従来のGBNDより計算速度と予測精度が大幅に向上し、掘削・整形タスクで評価された。

Action: ロボットによる地形操作のシミュレーションや制御タスクにおいて、提案された局所化されたグラフベースニューラルダイナミクス（GBND）フレームワークの導入可能性を調査する。

Original: Localized Graph-Based Neural Dynamics Models for Terrain Manipulation domain ★★★

cs.LG updates on arXiv.org

BitHEP -- HEPにおける低精度MLの限界

提案されたBitNetアーキテクチャをHEPアプリケーションで評価し、分類、回帰、生成モデリングタスクにおける性能を分析。クォーク-グルーオン識別、SMEFTパラメータ推定、検出器シミュレーションでの適合性を調査し、効率と精度を比較。 BitNetは分類タスクで競争力があるが、回帰・生成タスクでは性能が変動し、限界と改善の余地が示された。

Action: HEP分野におけるBitNetの回帰・生成タスクでの性能限界を詳細に調査し、代替アーキテクチャや最適化手法の適用可能性を検討する。

Original: BitHEP -- The Limits of Low-Precision ML in HEP domain ★★

cs.LG updates on arXiv.org

HypoBench: 仮説生成のための体系的かつ原則的なベンチマーキングに向けて

大規模言語モデル（LLM）を用いた仮説生成への関心が高まる中、その評価手法が課題となっていた。本研究では、実世界および合成タスクを含む新しいベンチマーク「HypoBench」を提案し、LLMの仮説生成能力を多角的に評価した。結果、既存手法は有用なパターンを発見できるものの、特に難易度が高い合成データセットでは未発見のパターンが多く残っており、AIによる科学的発見支援の改善余地を示唆している。

Action: LLMを用いた仮説生成手法を調査し、HypoBenchベンチマークの適用可能性を検討する。

Original: HypoBench: Towards Systematic and Principled Benchmarking for Hypothesis Generation domain ★★★

cs.LG updates on arXiv.org

大規模グラフ上での効率的な学習：高密度化正則性補題を用いて

大規模グラフ学習における計算量・メモリコストの課題を解決 Intersecting Block Graph (IBG) を導入し、グラフを効率的に近似する手法を提案エッジ数ではなくノード数に線形な計算量で、ノード分類や知識グラフ補完などで高い性能を達成

Action: IBG (Intersecting Block Graph) を用いたグラフニューラルネットワークのアーキテクチャと、既存のグラフ学習手法との性能比較を調査・実装する。

Original: Efficient Learning on Large Graphs using a Densifying Regularity Lemma domain ★★

cs.LG updates on arXiv.org

外部知識注入による予測AI：株式市場のためのデータセットとベンチマーク

株価変動は、歴史的データだけでなく、経済、政策、戦争などの外部要因も複雑に影響するため、その動的な変化を捉えることが重要です。本研究では、時系列知識グラフから外部知識を取り込み、歴史的トレンドと組み合わせることで、株価予測を行う新しいメカニズムを提案しています。既存のデータセットがないため、株式市場データを対象とした包括的な時系列知識グラフデータセットを構築し、提案手法がベースラインを上回る有効性を示すことを実験で証明しました。

Action: 時系列知識グラフと Hawkes Process on Graphs の概念を理解し、金融市場以外のドメイン（例：需要予測、ソーシャルメディアトレンド分析）への応用可能性を検討する。

Original: Predictive AI with External Knowledge Infusion: Datasets and Benchmarks for Stock Markets domain ★★

cs.LG updates on arXiv.org

地理空間表現学習：深層学習からLLM時代までのサーベイ

地理空間表現学習（GRL）は、地理空間データを計算可能な表現に変換する分野であり、深層学習（DNN）と大規模言語モデル（LLM）の進化により変革期を迎えています。 DNNは衛星画像やGPS軌道などの構造化・半構造化データから特徴抽出に成功し、LLMはクロスモーダル推論や非構造化テキストデータの処理能力を向上させています。本サーベイは、データ、手法、応用の3つの視点からGRLを分類し、LLM時代における研究の限界と将来の方向性を示しています。

Action: GitHubリポジトリ `https://github.com/CityMind-Lab/Awesome-Geospatial-Representation-Learning` を参照して、最新の地理空間表現学習の研究論文リストを確認し、LLMとの連携における最新動向を調査する。

Original: Geospatial Representation Learning: A Survey from Deep Learning to The LLM Era domain ★★★

cs.LG updates on arXiv.org

LatticeVision: 非定常空間データのモデリングのための画像間ネットワーク

・非定常空間データにおける統計モデルのパラメータ推定は、最大尤度推定（MLE）では計算量が多く困難である。・既存研究では、ニューラルネットワークを用いて空間フィールドから直接パラメータを推定している。・本研究は、画像間（I2I）ネットワークを適用した「LatticeVision」により、複雑な非定常SARモデルのパラメータ推定を高速かつ高精度に行う手法を提案する。

Action: LatticeVisionのアプローチを調査し、非定常SARモデルのパラメータ推定への応用可能性を検討する。

Original: LatticeVision: Image to Image Networks for Modeling Non-Stationary Spatial Data domain ★★

cs.LG updates on arXiv.org

LLMにおける内在的自己修正：メカニズム的解釈可能性による説明可能なプロンプト作成に向けて

LLMは外部フィードバックなしにプロンプトだけで自己出力を洗練する「内在的自己修正」を行う。この現象は、隠れ表現を解釈可能な潜在的方向に誘導することで機能することを、活性化介入とアライメント分析で示した。テキストの無毒化・毒性化タスクでは、プロンプトによる表現シフトが対応する潜在的方向と一致し、メカニズム的ドライバーであることが示唆された。

Action: LLMのプロンプトと出力のメカニズム的解釈可能性を調査し、モデルの内部動作を理解するための分析手法を開発する。

Original: Intrinsic Self-Correction in LLMs: Towards Explainable Prompting via Mechanistic Interpretability domain ★★★

cs.LG updates on arXiv.org

コンテキストへの応答の帰属：検索拡張生成におけるコンテキスト帰属のジェンセン・シャノン発散駆動型メカニズム研究

検索拡張生成（RAG）は、外部コンテキストを用いてLLMの応答精度と信頼性を向上させます。本研究では、ファインチューニング不要で効率的かつ高精度なコンテキスト帰属を可能にする、ジェンセン・シャノン発散（JSD）駆動型の新しい方法（ARC-JSD）を提案します。評価により、既存手法を上回る精度と計算効率が示され、RAGモデルの内部動作に関する洞察も提供されます。

Action: ARC-JSDのGitHubリポジトリを確認し、提案されたコンテキスト帰属手法を試す。

Original: Attributing Response to Context: A Jensen-Shannon Divergence Driven Mechanistic Study of Context Attribution in Retrieval-Augmented Generation domain ★★★

cs.LG updates on arXiv.org

潜在ビデオ拡散モデルの破損認識学習による堅牢なテキストからビデオへの生成

既存の潜在ビデオ拡散モデル（LVDM）は、ノイズ条件下での脆さと意味論的ドリフトの問題を抱えている。本研究では、データアラインメントされたノイズ注入（BCNI、SACN）を用いる破損認識学習フレームワークCAT-LVDMを提案する。 CAT-LVDMは、少ないデータで既存モデルを凌駕する性能向上を示し、他の生成モデルや理解モデルへの転移可能性も証明した。

Action: 提案されているBCNIやSACNといったノイズ注入手法を、手持ちのビデオ生成モデルに適用し、その堅牢性向上効果を検証する。

Original: Corruption-Aware Training of Latent Video Diffusion Models for Robust Text-to-Video Generation domain ★★★

cs.LG updates on arXiv.org

ヘビーテイルノイズ下におけるモーメンタム付き正規化確率的一次最適化手法の複雑性

提案手法: モーメンタム付きの正規化確率的一次最適化手法（ポリアック、多重外挿、再帰モーメンタム）を開発。利点: パラメータが動的に更新され、問題依存量を事前に知る必要がない。複雑性: ヘビーテイルノイズ下でも、既存手法を上回る複雑性結果を達成。

Action: ヘビーテイルノイズ下での学習効率向上のため、提案されたモーメンタム付き最適化手法の理論的・実践的側面を調査し、関連するAI/MLモデルへの適用可能性を評価する。

Original: Complexity of normalized stochastic first-order methods with momentum under heavy-tailed noise domain ★★

cs.LG updates on arXiv.org

トポロジカルデータ解析によるIndustry 4.0における堅牢な短期OEE予測

Industry 4.0におけるOEE予測の課題に対し、トポロジカルデータ解析(TDA)を用いて解決策を提示。 TDA特徴量（例: Heat Kernel）をSARIMAXモデルに統合するフレームワークを提案し、予測精度を17%以上向上。製造施設での実証実験でOEEを7.4%改善し、知識集約型生産システムへの応用可能性を示唆。

Action: 業界4.0の運用管理や予知保全において、トポロジカルデータ解析(TDA)を用いたOEE予測の精度向上手法について、SARIMAXモデルへのTDA特徴量の統合方法を調査・実装する。

Original: Robust Short-Term OEE Forecasting in Industry~4.0 via Topological Data Analysis domain ★★★

cs.LG updates on arXiv.org

OrbitChain: 地球観測データの軌道上リアルタイム分析のオーケストレーション

地球観測データのリアルタイム分析の遅延問題を解決するため、軌道上での分析フレームワーク「OrbitChain」を提案。パイプライン設計と衛星コンステレーションリソースのオーケストレーションにより、数分での分析結果提供を実現。既存フレームワークより分析ワークロードを60%増加させ、衛星間通信オーバーヘッドを45%削減。

Action: OrbitChainのパイプライン設計や衛星リソースオーケストレーションの概念を、現在のデータ分析ワークフロー（例: web-file-binプロジェクトのレポート生成）に応用できないか調査する。

Original: OrbitChain: Orchestrating In-orbit Real-time Analytics of Earth Observation Data domain ★★★

cs.LG updates on arXiv.org

AUDETER: オープンワールドにおけるディープフェイク音声検出のための大規模データセット

「AUDETER」は、最新のTTSモデルとボコーダーで生成された300万クリップ（4,500時間以上）を含む、ディープフェイク音声検出のための大規模で多様なデータセットです。既存の検出モデルは、多様なディープフェイクや実際の音声に対する汎化性能が低いという課題がありますが、AUDETERで学習させたXLRベースの検出器は高いクロスドメイン性能を示しました。本研究では、多様なディープフェイクソースからの負の転移を軽減するためのカリキュラム学習ベースのアプローチも提案しています。

Action: GitHubで公開されているAUDETERデータセットと、ディープフェイク検出モデルの汎化性能向上に役立つカリキュラム学習ベースのアプローチを調査し、既存の検出システムへの適用可能性を検討する。

Original: AUDETER: A Large-scale Dataset for Deepfake Audio Detection in Open Worlds domain ★★

cs.LG updates on arXiv.org

Code2MCP: コードリポジトリをMCPサービスに変換する

MCP (Model Context Protocol) のツールプールを既存のソフトウェアプロジェクトで拡充する課題に対し、GitHubリポジトリをMCPサービスに自動変換するフレームワーク「Code2MCP」を提案。 Code2MCPは、コード分析、環境設定、ツール機能設計、サービス生成を自動化するマルチエージェントワークフローと自己修正ループを備える。科学分野（バイオインフォマティクス、数学、流体動力学）のオープンソースライブラリをMCPサービス化できることを実証し、MCPエコシステムの普及を加速する。

Action: GitHub上の既存リポジトリをMCPサービスに自動変換するCode2MCPフレームワークのコード（https://github.com/DEFENSE-SEU/Code2MCP）を確認し、自身のプロジェクトへの応用可能性を検討する。

Original: Code2MCP: Transforming Code Repositories into MCP Services domain ★★★

cs.LG updates on arXiv.org

合成住宅：生成AIを用いた住宅建築データ生成のためのアクセス可能なマルチモーダルパイプライン

生成AIを活用し、公開画像と住宅情報から建築データを生成することで、データへのアクセス性やプライバシーの問題に対応。リアルなマルチモーダルデータを生成し、AIモデルの一般的な問題を回避する、モジュール式のマルチモーダルフレームワークとパイプラインを提案。高価または制限のあるデータソースへの依存を減らし、機械学習（ML）などのデータ駆動型分野の研究をよりアクセスしやすくする道を開く。

Action: 生成AIを用いたデータ生成パイプラインの構築方法について、提案されたフレームワークのモジュール構成を調査し、ローカル環境での PoC（概念実証）を検討する。

Original: Synthetic Homes: An Accessible Multimodal Pipeline for Producing Residential Building Data with Generative AI domain ★★

cs.LG updates on arXiv.org

インコンテキスト学習は学習なのか？

インコンテキスト学習（ICL）は、追加学習なしでタスクを解決できると主張されるが、その実態は限定的である。大規模分析により、ICLは一般化能力に限界があり、模倣や事前知識への依存が大きいことが示唆された。モデルはプロンプトの規則性からパターンを推測するが、これは学習メカニズムとして堅牢ではなく、汎用性に乏しい。

Action: ICLの汎用性と学習能力の限界を理解し、モデルの挙動を検証する際には、プロンプトエンジニアリングだけでなく、モデルの根本的な学習メカニズムやバイアスについても考慮する。

Original: Is In-Context Learning Learning? domain ★★★

cs.LG updates on arXiv.org

TableDART: テーブル理解のための動的適応型マルチモーダルルーティング

テーブル理解におけるテキストと画像のモダリティの課題（構造・意味の喪失）を解決するため、TableDARTは軽量なMLPゲートネットワークを用いて、テーブルクエリペアごとに最適なルーティング（テキストのみ、画像のみ、または融合）を動的に選択します。事前学習済み単一モダリティモデルを再利用し、クロスモーダル知識統合エージェントにより、高価なMLLMのファインチューニングなしに、効率的かつ高精度なテーブル理解を実現します。 7つのベンチマークでの実験により、既存のオープンソースモデルを平均4.02%上回る新たなSOTAを達成しました。

Action: TableDARTのGitHubリポジトリを確認し、テーブル理解タスクにおけるマルチモーダルアプローチの効率化と精度向上について調査する。

Original: TableDART: Dynamic Adaptive Multi-Modal Routing for Table Understanding domain ★★★

cs.LG updates on arXiv.org

HEART: 言語モデルの感情駆動型テスト時スケーリング

テスト時スケーリングにおけるAIモデルの誤った思考パターンを打開するため、感情的手がかり（批判的・励ましトーン）を用いて推論を導く新フレームワーク「HEART」を提案。 7つの高難易度ベンチマークで検証し、感情が深い推論を促進し、精度を向上させることを実証。機械的推論の進化には、論理的統合を導く感情的調節の戦略的統合が鍵となることを示唆。

Action: HEARTフレームワークの感情的調節戦略をLLMの推論能力向上に適用する方法を調査・実験する。

Original: HEART: Emotionally-Driven Test-Time Scaling of Language Models domain ★★★

cs.LG updates on arXiv.org

GeoPurify: オープンボキャブラリー3Dセグメンテーションのためのデータ効率的な幾何学的蒸留フレームワーク

2D VLMから3Dセグメンテーションへの転移における、ノイズの多い予測と高コストな学習・データというトレードオフを解消。 Student Affinity NetworkとGeometry-Guided Poolingにより、2D VLM特徴を幾何学的構造で精製し、データ効率と性能を向上。主要な3DベンチマークでSOTA性能を達成し、訓練データのわずか1.5%で同等以上の結果を示した。

Action: このGeoPurifyフレームワークのコア技術（幾何学的蒸留、アフィニティネットワーク、ガイド付きプーリング）を調査し、将来的な3Dデータ処理タスクへの応用可能性を検討する。

Original: GeoPurify: A Data-Efficient Geometric Distillation Framework for Open-Vocabulary 3D Segmentation domain ★★★

cs.LG updates on arXiv.org

マルチエージェント強化学習を用いたドウロ川プルームの長期マッピング

複数の自律型無人潜水機（AUV）を用いた河川プルーム（ドウロ川）の長期マッピング問題を研究。中央調整機がAUVと断続的に通信し、測定値収集とコマンド発行を行う、エネルギー効率と通信効率の高いマルチエージェント強化学習アプローチを提案。時空間ガウス過程回帰とマルチヘッドQネットワークコントローラーを統合。シミュレーションにより、提案手法はベンチマークを上回り、エージェント数の増加が精度と耐久性を向上させ、異なる季節や年を越えて汎化することが実証された。

Action: マルチエージェント強化学習とガウス過程回帰を組み合わせた自律システム制御の実現可能性を調査し、シミュレーション環境での検証を検討する。

Original: Long-Term Mapping of the Douro River Plume with Multi-Agent Reinforcement Learning domain ★★★

cs.LG updates on arXiv.org

建設的歪曲：Attention誘導型画像歪曲によるMLLMの改善

MLLMは、散らかったシーンの微細な詳細や空間関係を捉えるのが苦手で、知覚的グラウンディングに誤りが生じやすい。 AttWarp は、MLLM のクロスモーダルアテンションを利用し、クエリ関連領域に解像度を重点配分・非関連領域を圧縮する軽量手法で、モデル構造変更なしに画像全体を歪曲する。 LLaVA、Qwen-VL 等4種の MLLM と5種のベンチマークで、精度向上、構成的推論強化、幻覚削減を達成し、既存手法を上回る。

Action: AttWarp の手法を LLaVA や Qwen-VL などの既存 MLLM に適用し、その効果を検証する。特に、複雑なシーンや細かい指示に対する性能向上に注目する。

Original: Constructive Distortion: Improving MLLMs with Attention-Guided Image Warping domain ★★★

cs.LG updates on arXiv.org

HyperAIRI: 高精度な無線干渉計におけるハイパースペクトル画像再構成のためのプラグアンドプレイアルゴリズム

本論文では、無線干渉計におけるハイパースペクトル画像再構成のために、AIRIプラグアンドプレイ（PnP）アプローチを拡張したHyperAIRIを提案する。 HyperAIRIは、べき乗則スペクトルモデルを強制する学習済みハイパースペクトルデノイザーを使用し、ヤコビアン正則化で収束を確保する。シミュレーションおよび実観測において、Hyper-uSARAやWSCleanのハイパースペクトル版などの既存手法に対し、その優れた性能を示している。

Action: 現在のトレンドに関連する科学的画像再構成タスクにおける、プラグアンドプレイ（PnP）アルゴリズムと学習済みデノイザーの可能性を探求する。

Original: HyperAIRI: a plug-and-play algorithm for precise hyperspectral image reconstruction in radio interferometry domain ★★

cs.LG updates on arXiv.org

高次元線形回帰における量子化下での学習

低ビット量子化は大規模モデルの効率的な学習に不可欠だが、その学習性能への影響の理論的理解は不足している。本研究は、高次元線形回帰におけるSGDに対するデータ、ラベル、パラメータ、活性化、勾配の量子化の影響を理論的に分析し、過剰リスク限界を導出する。加法量子化と乗法量子化の効果を区別し、それぞれがノイズ増幅やスペクトル歪みに与える影響を定量的に比較・評価する。

Action: 研究結果に基づき、モデルの量子化手法（加法 vs 乗法）と学習性能への影響を理解し、実際のモデル最適化やデプロイ戦略に活かす方法を検討する。

Original: Learning under Quantization for High-Dimensional Linear Regression domain ★★★

cs.LG updates on arXiv.org

組成データのためのコンフォーマル予測

組成データ（合計が1になる割合）の分析に、Dirichlet回帰モデルとコンフォーマル予測を適用。予測集合の構築における課題を調査し、量化残差、HDR近似、グリッドベースHDRの3つの戦略を提案・評価。シミュレーションと実データ（睡眠段階、植物のバイオマス配分）で有効性を確認し、HDR近似の頑健性やグリッド手法の改善効果を実証。

Action: 組成データ解析や予測モデル構築に、提案されたコンフォーマル予測手法（HDR近似、グリッド近似）の導入を検討し、必要であればPython/Rでの実装を調査する。

Original: Conformal Prediction for Compositional Data domain ★

cs.LG updates on arXiv.org

仕様の罠：なぜコンテンツベースのAI価値整合では堅牢な整合性が得られないのか

コンテンツベースのAI価値整合（形式的な価値目標の最適化）は、能力のスケーリング、分布シフト、自律性の増加下で堅牢な整合性を達成できない。この限界は、フユームの「である・べき」の断絶、ベルリンの価値多元主義、拡張されたフレーム問題といった哲学的結果に起因する。 RLHFやConstitutional AIなどの手法は構造的な失敗モードを持ち、問題は価値仕様から価値創発へと再定義されるべきである。

Action: AIの価値整合における「価値仕様」から「価値創発」への転換に関する最新の研究動向を調査し、プロジェクトへの応用可能性を検討する。

Original: The Specification Trap: Why Content-Based AI Value Alignment Cannot Produce Robust Alignment domain ★★

cs.LG updates on arXiv.org

CoRe3D: 3Dインテリジェンスの基盤としての共同推論

CoRe3Dは、意味論的・空間的抽象化を組み合わせた3D理解・生成のためのフレームワークです。「空間に根差した推論表現」により、3D潜在空間を分解し、幾何学的な操作を構成的・手続き的に行います。これにより、言語記述と強く整合し、局所的な一貫性を持つ3D出力を生成します。

Action: 3Dコンテンツ生成ツールに、言語指示に基づいた推論メカニズムを統合する方法を調査する。

Original: CoRe3D: Collaborative Reasoning as a Foundation for 3D Intelligence domain ★★

cs.LG updates on arXiv.org

SecureCode: セキュリティを意識したコード生成モデルのトレーニングのための本番グレードのマルチターンデータセット

AIコーディングアシスタントはセキュリティ関連シナリオの45%で脆弱なコードを生成するが、公開されているトレーニングデータセットは存在しない。本研究では、OWASP Top 10 2021 WebセキュリティとOWASP LLM Top 10 2025 AI/MLセキュリティを網羅する「SecureCode」データセットを提案。 4ターンの会話構造、SIEM統合戦略、インフラ強化、テストアプローチを含み、Hugging Faceで公開。

Action: SecureCodeデータセットを調査し、AIコーディングアシスタントのセキュリティ向上に活用する方法を検討する。

Original: SecureCode: A Production-Grade Multi-Turn Dataset for Training Security-Aware Code Generation Models domain ★★★

cs.LG updates on arXiv.org

「忘れられる権利」の証明：垂直連邦学習におけるサンプルおよびラベルのアンラーニングのためのprimal-dual最適化

垂直連邦学習（VFL）におけるアンラーニング（サンプル・ラベル削除）は、特徴の分散とパーティ間連携が課題。FedORAはこれを解決するprimal-dual最適化フレームワークを提案。 FedORAは、分類の不確実性を促す損失関数、適応ステップサイズ、非対称バッチ設計により、計算コストを削減し、学習・保持データを効率的に扱う。理論的保証と実験により、FedORAはゼロからの学習と同等の効果とデータ保持性を、大幅な計算・通信オーバーヘッド削減で達成することを示す。

Action: VFL環境におけるFedORAアルゴリズムの実装可能性や、関連するプライバシー保護機械学習ライブラリでの応用について調査する。

Original: Certifying the Right to Be Forgotten: Primal-Dual Optimization for Sample and Label Unlearning in Vertical Federated Learning domain ★★★

cs.LG updates on arXiv.org

汎用エージェントの能動的評価：問題定義とベースラインアルゴリズムの比較

汎用AIエージェントの評価コスト増大という課題に対し、能動的評価のフレームワークを提案。ランキングアルゴリズムがタスクとエージェントを選択し、評価を進めるオンライン型アプローチ。 EloレーティングとSoft Condorcet Optimizationを比較し、実用性ではEloが、Atariエージェント評価ではSoft Condorcetが優位であることを確認。

Action: 汎用AIエージェントの性能評価における能動的評価フレームワークの導入を検討し、既存の評価手法との比較実験を行う。

Original: Active Evaluation of General Agents: Problem Definition and Comparison of Baseline Algorithms domain ★★★

cs.LG updates on arXiv.org

モジュラーサブグラフ統合による効率的な因果構造学習

高次元設定における因果構造学習は計算負荷が高く、既存手法には課題があります。 VISTAフレームワークは、マルコフブランケットに基づく局所サブグラフへの分解と、重み付き投票メカニズムによる統合でこの問題を解決します。モデル非依存、並列処理可能で、理論的保証と実証実験での高い精度・効率改善を示します。

Action: VISTAフレームワークを調査し、因果発見タスクへの応用可能性を評価する。

Original: Efficient Causal Structure Learning via Modular Subgraph Integration domain ★★★

cs.LG updates on arXiv.org

埋め込みのスケーリングは、言語モデルにおけるエキスパートのスケーリングを上回る

大規模言語モデル（LLM）において、従来のMixture-of-Experts (MoE) アーキテクチャの限界が見られる中、埋め込み（Embedding）のスケーリングが性能向上のための有望な代替次元であることが示唆されています。本研究では、埋め込みスケーリングが特定条件下でエキスパートスケーリングよりも優れた性能を発揮すること、またモデルの幅や深さとの相互作用が重要であることを明らかにしました。これらの知見に基づき、LongCat-Flash-Lite (68.5Bパラメータ) が開発され、MoEベースラインを凌駕し、特にエージェントやコーディングタスクにおいて高い競争力を持つことが実証されました。

Action: LLMの埋め込みスケーリング戦略を調査し、モデルの性能と推論速度の向上にどのように寄与するかを実験・評価する。

Original: Scaling Embeddings Outperforms Scaling Experts in Language Models domain ★★★

cs.LG updates on arXiv.org

リスク認識注入：ビジョン・言語モデルの安全性をユーティリティを損なわずに調整する

ビジョン・言語モデル（VLMs）は、マルチモーダルなジェイルブレイク攻撃に対して脆弱です。既存の防御策は、コストがかかるか、ユーティリティを低下させます。 RAI（リスク認識注入）は、トレーニング不要な軽量フレームワークであり、安全でないシグナルを増幅することで、ユーティリティを損なわずにVLMsのリスク認識能力を回復させます。

Action: RAI（リスク認識注入）のようなトレーニング不要な安全キャリブレーション手法を調査し、既存のVLM（ビジョン・言語モデル）への適用可能性を評価する。

Original: Risk Awareness Injection: Calibrating Vision-Language Models for Safety without Compromising Utility domain ★★

cs.LG updates on arXiv.org

OAT: 順序付けられたアクショントークン化

ロボット学習における連続的なアクションの効率的なトークン化手法「OAT (Ordered Action Tokenization)」を提案。 OATは、高い圧縮率、完全な復号可能性、因果的に順序付けられたトークンスペースという3つの要件を満たす学習ベースのトークナイザー。既存手法を凌駕し、推論時の柔軟性とコスト/忠実度のトレードオフを可能にする。

Action: 連続的なロボットアクション制御や自己回帰モデルを扱うプロジェクトにおいて、OATの実装や調査を検討する。

Original: OAT: Ordered Action Tokenization domain ★★★

cs.LG updates on arXiv.org

配分における予測の価値を実証的に理解する

資源配分における予測の重要性を実証的に分析するためのツールキットを開発しました。予測への投資と、設備拡張や治療品質向上といった代替案とのトレードオフを定量化します。ドイツの雇用サービスとエチオピアの貧困対策の事例で、意思決定者が予測の相対的価値を評価する方法を示します。

Action: この論文で紹介されている実証的ツールキット `rvp` とデータセットを調査し、リソース配分最適化への応用可能性を検討する。

Original: Empirically Understanding the Value of Prediction in Allocation domain ★★

cs.LG updates on arXiv.org

選好ベースの多目的強化学習を用いた社会の価値システムの学習

AIは人間の価値観を認識し、多様なユーザーの価値システムに適応する必要がある。本研究では、クラスタリングと選好ベースの多目的強化学習（PbMORL）を用いたアルゴリズムを提案する。これにより、社会的な価値整合モデルと、ユーザーグループごとの価値システムを効率的に表現するモデルを共同で学習する。

Action: PbMORLアルゴリズムや、多様なユーザー選好を考慮したAIエージェントの学習手法について調査・実験する。

Original: Learning the Value Systems of Societies with Preference-based Multi-objective Reinforcement Learning domain ★★★

stat.ML updates on arXiv.org

LLMが著しく劣化した場合：モデル劣化を検出するための統計的アプローチ

LLMの最適化（量子化など）後、モデル品質の劣化を保証することが重要だが、数値誤差によりモデル生成は必ずしもロバストではない。本論文では、モデル劣化を効率的に検出し、誤検出率を制御するための統計的仮説検定フレームワーク（McNemar's testに基づく）を提案する。各サンプルでモデルスコアを比較することが重要であり、複数のベンチマークを横断する精度推定の集計方法も提示されている。

Action: LLMのデプロイメント評価のために、モデル劣化を検出する統計的フレームワークの導入を検討する。

Original: When LLMs get significantly worse: A statistical approach to detect model degradations domain ★★★

stat.ML updates on arXiv.org

実行的予測の分析：包括的サーベイ

実行的予測（Performative Prediction）は、2020年にモデル展開がデータ分布をシフトさせる機械学習設定として登場しました。近年、新しい解法、設定の拡張、理論的分析、他分野との交差が研究されています。本サーベイは、分布マップ情報に基づく分類、既存手法の調査、他分野との関連性の指摘を通じて、今後の研究を促進することを目指します。

Action: 実行的予測の設定分類方法や、関連分野との新たな接続を調査する。

Original: Dissecting Performative Prediction: A Comprehensive Survey domain ★★

stat.ML updates on arXiv.org

Power-SMC: トレーニングフリーLLM推論のための低遅延シーケンスレベルパワースケーリング

大規模言語モデル（LLM）の推論遅延を大幅に削減する「Power-SMC」手法を提案。従来のMetropolis-Hastingsサンプリングより数倍高速な、GPUフレンドリーなシングルパス・シーケンシャルモンテカルロ法。 MATH500データセットにおいて、既存手法と同等以上の精度を維持しつつ、推論速度を大幅に向上。

Action: LLMの推論速度改善のため、Power-SMCの技術を調査し、自身のプロジェクトでの適用可能性を検討する。

Original: Power-SMC: Low-Latency Sequence-Level Power Sampling for Training-Free LLM Reasoning domain ★★★

stat.ML updates on arXiv.org

学習済み楽器変数表現による因果効果推定

観測データにおける未観測の交絡を軽減するための楽器変数（IV）法は、有効な楽器の特定が困難な場合が多い。本研究は、観測された共変量から楽器表現を構築するアプローチ（ZNet）を提案し、明示的な楽器がない場合でもIVベースの因果効果推定を可能にする。 ZNetは、構造的因果モデルに倣い、特徴空間を分解し、有効な楽器の性質を学習することで、因果推論の「プラグイン」モジュールとして機能する。

Action: ZNetを、未観測の交絡がある設定での因果推論のための「プラグイン」モジュールとして評価・実装する。

Original: Causal Effect Estimation with Learned Instrument Representations domain ★★★

stat.ML updates on arXiv.org

高次元ノイズ下での一般化ロバスト適応帯域幅マルチビュー多様体学習

複数のノイズが多いデータソースを統合するための、一般化されたロバスト適応帯域幅マルチビュー拡散マップ（GRAB-MDM）を提案。各ビューの幾何学的構造とノイズレベルに適応するビュー依存の帯域幅選択戦略が、安定したマルチビュー拡散演算子の構築を可能にする。理論的な収束性と共有構造の頑健な回復を示し、数値実験で既存手法を上回る性能を実証。

Action: GRAB-MDMフレームワークの理論的基盤と実装可能性について調査する。

Original: Generalized Robust Adaptive-Bandwidth Multi-View Manifold Learning in High Dimensions with Noise domain ★★

stat.ML updates on arXiv.org

崩壊から改善へ：汚染されたソースでの反復トレーニングの進化ダイナミクスの統計的視点

生成モデルの反復学習におけるモデル崩壊は課題だが、真のターゲット分布からの情報があれば、汚染されたデータでも改善の可能性がある。真の分布と合成分布の混合データでの反復学習を分析すると、混合比率とサンプルサイズが長期的な性能を制御する。適切なサンプルサイズでの汚染非依存学習は、崩壊を回避し、特定の条件下では真の分布を回復できる可能性がある。

Action: AIモデルの反復学習において、データ汚染下での混合比率とサンプルサイズがモデル性能に与える影響を調査し、改善の可能性を探る。

Original: From Collapse to Improvement: Statistical Perspectives on the Evolutionary Dynamics of Iterative Training on Contaminated Sources domain ★★★

stat.ML updates on arXiv.org

SHAP（Shapley Additive Explanations）のための統計的推論と学習

SHAPは変数重要度の割り当てに不可欠なフレームワークであり、ゲーム理論のShapley値を使用します。ローカルな説明からグローバルな特徴量重要度への変換には課題があり、既存の手法には統計的推論がありません。本論文では、SHAP値のべき乗に対する統計的推論を行うための半パラメータアプローチを提案し、漸近正規推定量を構築します。

Action: SHAP値の推定精度に対する統計的信頼性を向上させるために、本論文で提案されている半パラメータアプローチや漸近正規推定量の実装を検討する。

Original: Statistical Inference and Learning for Shapley Additive Explanations (SHAP) domain ★★

stat.ML updates on arXiv.org

エージェント型定理証明器はなぜ機能するのか：数理推論モデルの統計的証明可能性理論

エージェント型定理証明器は、推論モデル、ライブラリ検索、計画、検証を組み合わせ、実証的な成功を収めている。本稿では、有限ホライズンの成功確率として「統計的証明可能性」を提案し、これらのシステムを時間制約付きMDPとしてモデル化する。この理論は、偏りのある現実の問題分布におけるエージェント型定理証明器の成功を説明し、限界を明確にする。

Action: エージェント型定理証明器の性能を支える統計的証明可能性理論を調査し、既存のAIツールへの応用可能性を検討する。

Original: Why Agentic Theorem Prover Works: A Statistical Provability Theory of Mathematical Reasoning Models domain ★★★

stat.ML updates on arXiv.org

深層ブートストラップ

条件付き拡散モデルを用いた非階層回帰のための新しい深層ブートストラップフレームワークを提案。条件付き分布推定、サンプリング、非階層回帰を統合した統一的生成フレームワークを構築。高次元・多峰性分布からの効率的なサンプリングと高精度な非階層推定を実現し、理論的保証と数値実験で有効性を示唆。

Action: 条件付き拡散モデルを用いた非階層回帰の理論的・実践的側面を調査し、関連ライブラリ（例: PyTorch Diffusion, TensorFlow Probability）での実装可能性を検討する。

Original: Deep Bootstrap domain ★★

stat.ML updates on arXiv.org

経験的尤度を通じた文脈付きバンディット・ポリシーのベイズ推論

文脈付きバンディット問題におけるポリシー推論のため、経験的尤度を用いたベイズ推論手法を提案。小標本サイズに頑健で、ポリシー価値評価の不確実性を高精度に測定可能。モンテカルロシミュレーションと実データ（青少年BMI）への応用で有効性を示した。

Action: 提案された経験的尤度を用いたベイズ推論手法を、実際のバンディット問題（例: レコメンデーションシステム、広告配信）に適用し、その効果を検証する。

Original: Bayesian Inference of Contextual Bandit Policies via Empirical Likelihood domain ★★★

stat.ML updates on arXiv.org

高適応性主成分回帰

HAL/HARの計算コスト問題を解決するため、主成分を用いたPCHAL/PCHARを提案。これらは計算効率が大幅に向上し、既存手法と同等の性能を発揮する。主要な主成分と離散正弦基底との間にスペクトル的な関連性があり、フーリエ型構造が明らかになった。

Action: PCHAL/PCHARの実装詳細と、既存の機械学習パイプラインでの応用可能性について調査する。

Original: Highly Adaptive Principal Component Regression domain ★★

stat.ML updates on arXiv.org

Kemeny中央値を超えて：合意順位分布の定義、性質、および統計的学習

「Kemeny中央値」を超える順位分布（対称群上の確率分布）の要約法を開発。転送量（mass transportation）の観点から歪みを抑え、順位分布を近似する「合意順位分布」（CRD）を提案。ランキングデータからCRDを学習するための効率的なトップダウン統計アルゴリズムを提案し、数値実験でその有効性を実証。

Action: ランキングデータからの合意順位分布(CRD)学習アルゴリズムの実装を検討し、推薦システムや統計モデリングへの応用可能性を探る。

Original: Beyond Kemeny Medians: Consensus Ranking Distributions Definition, Properties and Statistical Learning domain ★★

stat.ML updates on arXiv.org

非線形オートエンコーダーがPCAでは見えない構造を学習し、テスト損失が汎化と一致しない、解ける高次元モデル

多くのデータセットには、PCAのような線形相関では検出できない隠れた構造が存在する。非線形ニューラルネットワーク（オートエンコーダー）は、このような隠れた構造を抽出することに成功する。本研究では、非線形オートエンコーダーがPCAより優れた構造抽出能力を持つことを示す、解ける高次元モデルを提案。テスト損失と汎化性能の不一致についても論じる。

Action: 提案された高次元モデルと非線形オートエンコーダーの構造抽出能力について、追加の研究や実験を検討する。

Original: A solvable high-dimensional model where nonlinear autoencoders learn structure invisible to PCA while test loss misaligns with generalization domain ★★

stat.ML updates on arXiv.org

スライス最適輸送を用いた分布マッチングの収束率

スライス最適輸送に基づく分布マッチング手法「スライス・マッチング・スキーム」の収束性を解析し、Ojasiewicz型不等式を用いて非漸近的な収束率を定量的に導出しました。ガウス分布に対する理論的扱いやすさや、正規直交基底サンプリングによる安定化効果を数値実験で検証しました。

Action: スライス最適輸送を用いた分布マッチング手法の収束率に関する理論的知見を、機械学習モデル（特に生成モデル）への応用可能性を検討するために調査する。

Original: Convergence Rates for Distribution Matching with Sliced Optimal Transport domain ★

stat.ML updates on arXiv.org

観測データからの堅牢な品揃え最適化

品揃え最適化は、顧客の嗜好の変動やモデルの誤指定により、現実世界で課題が生じやすい。本研究では、顧客行動の分布シフトを考慮した堅牢な品揃え最適化フレームワークを提案し、最悪ケースの期待収益最大化を目指す。「堅牢なアイテムごとのカバレッジ」をサンプル効率の良い堅牢な品揃え学習に不可欠なデータ要件として特定し、堅牢性と統計的効率性のギャップを埋める。

Action: データ駆動型品揃え最適化における堅牢性フレームワークの実装可能性を調査し、関連ライブラリ（例：Pythonのscikit-optimize, Pyomoなど）の利用を検討する。

Original: Robust Assortment Optimization from Observational Data domain ★★

stat.ML updates on arXiv.org

階層的スペクトル法を用いた合成ターゲットの深層学習

深層学習における層の深さが計算上の優位性をもたらす理由を、高次元ガウス設定と合成ターゲット関数で研究。 3層モデルと層別スペクトル推定器を用い、中間表現が入力レベルではアクセスできない構造を明らかにし、学習を簡略化することを示す。これにより、浅い推定器が全ての要素を同時に解決しなければならないのに対し、深層学習戦略はサンプル複雑性で明確な差を生む。

Action: 階層的スペクトル法を用いた深層学習モデルの理論的背景を調査し、実装可能性について検討する。

Original: Deep Learning of Compositional Targets with Hierarchical Spectral Methods domain ★★

stat.ML updates on arXiv.org

深層における最適な初期化：Lyapunov初期化と深いLeaky ReLUネットワークの極限定理

深いLeaky ReLUニューラルネットワークにおける初期化手法を確率論的に解析。活性化の安定性を特徴づける「Lyapunov指数」を導入し、消失・爆発の相転移を特定。提案された「Lyapunov初期化」により、ネットワークの安定性を最大化し、学習効率の向上を目指す。

Action: 深層学習モデルの初期化手法として、Lyapunov初期化を既存手法（He初期化、Orthogonal初期化）と比較検討し、その効果を検証する。

Original: Optimal Initialization in Depth: Lyapunov Initialization and Limit Theorems for Deep Leaky ReLU Networks domain ★★★

stat.ML updates on arXiv.org

拡散モデル事前分布に基づく逆問題のためのギブスポステリアサンプラー

論文では、拡散モデルを事前分布に用いた逆問題に対し、ベイズ的枠組みでの後部標本化に焦点を当てています。従来困難とされてきた後部標本化のために、新規のギブスアルゴリズムを導入し、その有効性と簡潔性を示しています。提案手法は収束保証を持ち、数値シミュレーションによってその効果が確認されています。

Action: 拡散モデルとギブスサンプリングを組み合わせた逆問題解析手法の技術動向を調査し、データ分析やトレンド予測への応用可能性について検討する。

Original: A Gibbs posterior sampler for inverse problem based on prior diffusion model domain ★★

stat.ML updates on arXiv.org

堅牢な確率的・テールイベント予測のためのシグネチャカーネルベース評価指標

確率的予測は重要だが、現在の評価指標は複雑な依存関係を捉えられず、重要な「テールイベント」に鈍感である。シグネチャカーネルを活用し、依存関係や欠損データを扱えるSig-MMDとCSig-MMDという新たなカーネルベース指標を提案。CSig-MMDは特にテールイベントに焦点を当てる。これらの指標により、多段階予測の評価がより信頼でき、堅牢な確率的予測アルゴリズムの開発が促進される。

Action: 提案されたSig-MMDおよびCSig-MMD指標を、確率的予測モデルの評価に導入することを検討する。

Original: Signature-Kernel Based Evaluation Metrics for Robust Probabilistic and Tail-Event Forecasting domain ★★★

stat.ML updates on arXiv.org

COVID-19患者におけるICU転帰予測のための胸部X線画像におけるカーネルベース学習

カーネル法は複雑な非線形パターンを捉えるのに有効ですが、単一カーネルは限定的です。提案手法GLIMARK（Generalized Linear Models with Integrated Multiple Additive Regression with Kernels）は、指数型分布族の出力を扱えるようにMKLを拡張したものです。この手法はCOVID-19の胸部X線画像からICU転帰を予測するために応用され、臨床的に意味のある特徴を抽出しました。

Action: 提案されたGLIMARK手法（指数型分布族の出力に対応するMKLの拡張）について調査し、他の予測モデリングタスクへの応用可能性を検討する。

Original: Kernel-Based Learning of Chest X-ray Images for Predicting ICU Escalation among COVID-19 Patients domain ★★

stat.ML updates on arXiv.org

ICODEN：区間打ち切りデータのための常微分方程式ニューラルネットワーク

区間打ち切りデータにおけるイベント発生までの時間を予測する課題に対し、ICODEN（常微分方程式ニューラルネットワーク）を提案。比例ハザード仮定や特定のパラメトリック形式を必要とせず、高次元予測子にも対応できる柔軟な生存時間モデリングを実現。 ADNIやAREDS/AREDS2のデータ解析で実証され、高次元の生物医学分野における実用的かつ仮定の少ない予測ツールとして有用。

Action: ICODENのアルゴリズムを調査し、類似のデータセットでその予測性能を評価するPoC（概念実証）を計画する。

Original: ICODEN: Ordinary Differential Equation Neural Networks for Interval-Censored Data domain ★★★

stat.ML updates on arXiv.org

一般化された予測駆動型推論と二値分類器評価への応用

本論文は、部分観測された結果設定において、機械学習モデルの予測を利用して推定量を改善する「予測駆動型推論」（PPI）を提案します。 PPIを様々な推定量に一般化し、計算上シンプルな既存手法の代替となりうることを示しますが、半パラメータ効率限界には達しません。共変量分布シフトに対応するための修正PPI推定量を提案し、AUCおよび率指標への応用を示しています。

Action: 本論文で提案されている予測駆動型推論（PPI）の概念を理解し、特に共変量分布シフトが発生するシナリオにおけるモデル評価への応用可能性を調査する。自身のMLプロジェクトにおいて、PPI手法を実装または利用することを検討する。

Original: Generalized Prediction-Powered Inference, with Application to Binary Classifier Evaluation domain ★★

stat.ML updates on arXiv.org

より多くの予測は統計的推論を改善するか？フィルタリングされた予測駆動型推論

AIの進歩により、統計的推論における課題がデータ不足からデータの信頼性へと移行している。既存の予測駆動型推論手法は、予測品質が不均一な場合に精度を低下させる可能性がある。新提案のFPPIフレームワークは、適応的にフィルタリングされた領域内の予測を選択的に利用し、推定精度を向上させる。

Action: 機械学習モデルや統計的推論において、外部からの予測結果の品質が不均一な場合、FPPIの考え方を参考に、信頼性の高い予測のみを選択的に利用するフィルタリング機構を導入することを検討する。

Original: Do More Predictions Improve Statistical Inference? Filtered Prediction-Powered Inference domain ★★★

stat.ML updates on arXiv.org

カットを排除しない：LLMベースの定理証明における指数関数的な分離

LLMによるインタラクティブな定理証明の理論的分析を行い、カット（論理規則）を維持する学習器が、カットを排除した学習器よりも指数関数的に少ないデータで済むことを示しました。この結果は、最近のエージェント型定理証明器におけるサブゴールの分解を原理的に正当化します。分析は、証明DAG構造やマルコフ決定過程（MDP）の枠組みを用いて行われました。

Action: LLMベースの定理証明における「カット」の概念とその効率向上への寄与を調査し、既存の定理証明器（例: Lean）やAIエージェントへの応用可能性を検討する。

Original: Don't Eliminate Cut: Exponential Separations in LLM-Based Theorem Proving domain ★★

stat.ML updates on arXiv.org

小規模モデルのμスケーリング：原理に基づいたウォームスタートとハイパーパラメータ転移

1. 大規模ニューラルネットワークの学習効率化のため、小規模モデルから大規模モデルへ知識を転移させる「モデルアップスケーリング」手法について論じている。 2. アップスケーリング時のハイパーパラメータ調整コストが高いという課題に対し、モデル幅に着目した原理的なアプローチと、μTransferを発展させた効率的なハイパーパラメータ転移手法を提案している。 3. 提案手法は、幅広いアーキテクチャに適用可能で、理論的保証と実データでの有効性を示しており、モデル学習の効率化に寄与する。

Action: 提案されているモデルアップスケーリング手法とμTransferを用いたハイパーパラメータ転移技術を、自社開発のAIモデル学習パイプラインに適用可能か調査し、PoC（概念実証）を実施する。

Original: $\mu$pscaling small models: Principled warm starts and hyperparameter transfer domain ★★★

stat.ML updates on arXiv.org

TRACE: 共変シフト効果下における理論的リスク帰属

共変シフト下でのモデル性能変化を理解するための新フレームワーク「TRACE」を提案。TRACEは、モデル置換によるリスク変化を4つの要因（一般化ギャップ、モデル変更ペナルティ、共変シフトペナルティ）に分解し、診断ツールとして機能します。各要因は、モデル感度、データシフト測定（Optimal TransportやMaximum Mean Discrepancy）、出力距離などを用いて推定され、性能変化の原因を特定します。提案されたデプロイメントゲートスコアは、リスク変化と強く相関し、モデル置換の意思決定を支援します。

Action: 本フレームワーク（TRACE）を、本番環境へのモデル更新時の性能劣化監視に適用可能か調査し、診断スコアの実装を検討する。

Original: TRACE: Theoretical Risk Attribution under Covariate-shift Effects domain ★★

stat.ML updates on arXiv.org

物理情報ニューラルネットワークにおける物理とデータの整合性の役割について

PINNs（物理情報ニューラルネットワーク）は、ラベル付きデータが少ない場合に物理法則を制約として活用するが、実データはしばしば不整合を伴う。このデータと物理法則の不整合は「整合性バリア」を生み、PINNsの到達可能な精度を制限する。高精度なデータを用いることで、PINNsの学習はデータ不整合による制限から解放され、解析データを用いた場合と同等の精度が得られる。

Action: 実践的なPINNs適用において、データ品質と物理法則の整合性がモデル精度に与える影響を調査・評価する。

Original: On the Role of Consistency Between Physics and Data in Physics-Informed Neural Networks domain ★★

stat.ML updates on arXiv.org

粗視化ボルツマン生成器

ボルツマン分布からの平衡分子配置サンプリングは難題であり、既存手法はスケーラビリティに限界があった。本研究では、スケーラブルな低次元モデリングと正確な重要度サンプリングを統合した「粗視化ボルツマン生成器 (CG-BGs)」を提案する。 CG-BGsは、学習したポテンシャル・オブ・ミーン・フォース(PMF)を用いて、より大規模な分子システムの偏りのないサンプリングへのスケーラブルな道筋を提供する。

Action: 粗視化ボルツマン生成器(CG-BGs)の基盤技術である流体ベースモデルや力線マッチング（force matching）の最新実装やライブラリについて調査し、その応用可能性を検討する。

Original: Coarse-Grained Boltzmann Generators domain ★★★

stat.ML updates on arXiv.org

半双対および適応勾配法による高速かつ大規模な不均衡最適輸送

・不均衡最適輸送（UOT）におけるスケーラブルなアルゴリズム、特に勾配降下法（SGD）を用いた手法の課題に対処します。・エントロピックUOTの半双対定式化を分析し、SGDメソッドが局所的な曲率に適応することで、大規模アプリケーションに適した収束速度を達成することを示します。・離散設定向けに修正された適応Nesterov加速勾配（ANAG）法を提案し、その計算複雑性を理論的に証明します。

Action: この論文で提案されている不均衡最適輸送の高速化・大規模化手法を調査し、`web-file-bin`プロジェクトにおけるデータ分析やトレンド抽出処理への応用可能性を検討する。

Original: Fast and Large-Scale Unbalanced Optimal Transport via its Semi-Dual and Adaptive Gradient Methods domain ★★

stat.ML updates on arXiv.org

MCMCにおける前処理器の学習と適用に関する非漸近解析

MCMCアルゴリズムにおける前処理器の学習と適用の計算コストを非漸近的に解析しています。前処理器を学習する非調整ランジュバンアルゴリズム(ULA)に対する非漸近的保証を確立しています。前処理器学習コストの償却を正当化するため、近似独立性条件を形式化しています。

Action: MCMCアルゴリズムのパフォーマンス最適化に、この非漸近解析で提案されている前処理器学習手法の適用可能性を調査する。

Original: A Non-asymptotic Analysis for Learning and Applying a Preconditioner in MCMC domain ★

stat.ML updates on arXiv.org

グラフニューラルネットワークにおける適応的再配線の影響を探る

GNNのメモリ・計算コスト問題に対し、スパシフィケーション（疎化）を正則化として活用する手法を提案。ネットワーク科学と機械学習を融合し、電力網の信頼性評価などの実応用におけるGNNの効率化を検証。適応的再配線と早期停止の組み合わせが有望であり、スパシフィケーションパラメータの調整がGNN性能に重要であることを実験で示唆。

Action: GCNにアダプティブ・リワイヤリングを実装し、電力網データセットで性能を評価する。

Original: Exploring the impact of adaptive rewiring in Graph Neural Networks domain ★★★

stat.ML updates on arXiv.org

自然超勾配降下法：アルゴリズム設計、収束解析、および並列実装

二値最適化問題解決のための新手法「自然超勾配降下法（NHGD）」を提案。ヘッセ行列逆行列の計算ボトルネックを、経験的フィッシャー情報行列で代替することで解消し、並列フレームワークを実現。理論的保証と大規模機械学習における実用的な利点、スケーラビリティ、有効性を実証。

Action: NHGDのアルゴリズムを理解し、既存の二値最適化タスクや機械学習モデルへの適用可能性を調査する。

Original: Natural Hypergradient Descent: Algorithm Design, Convergence Analysis, and Parallel Implementation domain ★★★

stat.ML updates on arXiv.org

SoftMatcha 2: 大規模コーパス向けの高速かつソフトなパターンマッチャー

trillion-scale corpora (1.4T tokens) で 0.3秒未満で検索可能な、超高速で柔軟な検索アルゴリズム「SoftMatcha 2」を提案。文字列マッチングとディスクアウェア設計、動的なコーパス考慮型プルーニングにより、意味的なバリエーション（置換、挿入、削除）も処理。 FineWeb-Edu (1.4T tokens) での実験により、既存手法（infini-gram, SoftMatcha）よりも低遅延を達成し、学習コーパスのベンチマーク汚染を特定。

Action: 新しい検索アルゴリズム「SoftMatcha 2」の技術詳細を調査し、大規模データセットのベンチマーク汚染検出や、自然言語処理タスクへの応用可能性を検討する。

Original: SoftMatcha 2: A Fast and Soft Pattern Matcher for Trillion-Scale Corpora domain ★★

stat.ML updates on arXiv.org

欠損データを持つグラフィカルモデルにおける重み付けベースの同定と推定

欠損データを持つグラフィカルモデルにおける完全データ分布の同定アルゴリズムを提案。介入による選択バイアスの生成・伝播を追跡・回避するツリーベースの同定手法を導入。同定アルゴリズムに基づき、逆確率重み付け手順を開発し、Rパッケージ`flexMissing`で実装。

Action: Rパッケージ`flexMissing`を調査し、欠損データ処理におけるその適用可能性を評価する。

Original: Weighting-Based Identification and Estimation in Graphical Models of Missing Data domain ★★

stat.ML updates on arXiv.org

敵対的破損を伴う不均一分散一般化線形バンディットのための、効率的かつ最適な共同アルゴリズム

敵対的破損が存在する環境下での、不均一分散一般化線形バンディット（GLB）問題に対する効率的かつ最適なアルゴリズムを提案します。提案手法「HCW-GLB-OMD」は、オンラインミラー降下（OMD）推定器とヘッセ行列ベースの信頼重みを組み合わせ、計算効率（反復あたりO(1)）とロバスト性を両立させます。自己強変数性（self-concordance）の仮定のもとで、インスタンスごとのミニマックス最適性を達成するレグレットバウンドを示し、理論的な有効性を証明します。

Action: 敵対的破損に強いGLBアルゴリズムHCW-GLB-OMDの実装を検討し、MLシステムでの応用可能性を評価する。

Original: A Jointly Efficient and Optimal Algorithm for Heteroskedastic Generalized Linear Bandits with Adversarial Corruptions domain ★★

stat.ML updates on arXiv.org

生成的拡散モデルにおけるフォマープロセスの変分最適性

・確率的補間フレームワークを用いて、点質量を有限時間で目標分布へ輸送する生成拡散モデルを構築・解析する。・推定誤差の影響を最小化することで、フォマープロセス（相対エントロピーを最小化する拡散過程）を閉形式で選択できる新しい変分論的特徴付けを証明する。・最適化された拡散係数下では、経路空間のKLダイバージェンスが補間スケジューラに依存しなくなり、異なるスケジュールが統計的に等価になることを示す。

Action: 確率的補間フレームワークに基づいた生成拡散モデルを実装し、ドリフト計算のための条件付き期待値の推定に焦点を当てる。

Original: Variational Optimality of F\"ollmer Processes in Generative Diffusions domain ★★

stat.ML updates on arXiv.org

OSIL: 非選好軌道からの安全性推論によるオフライン安全模倣学習

オフライン安全模倣学習（IL）において、安全でない、または望ましくない軌道データから安全性を推論する新しいアルゴリズム「OSIL」を提案。明示的な安全コストや報酬アノテーションなしに、Constrained Markov Decision Process (CMDP) の枠組みで、安全かつ報酬最大化するポリシー学習を実現。実験により、コスト制約を満たしつつ報酬性能を維持し、既存手法を上回る安全なポリシー学習能力を実証。

Action: OSILアルゴリズムの論文を読み、その実装方法や、既存の模倣学習パイプラインへの適用可能性を調査する。

Original: OSIL: Learning Offline Safe Imitation Policies with Safety Inferred from Non-preferred Trajectories domain ★★

stat.ML updates on arXiv.org

Renet: 動的目的選択による、Elastic Net のための原理的かつ効率的な緩和

Elastic Net の予測精度を向上させるため、新しい緩和フレームワーク「Renet」を提案。 Renet は、既存手法の線形補間による課題を克服し、動的な適応的緩和により KKT 条件違反を防ぐ。 One-Standard-Error ルールとの相乗効果、高次元・低信号雑音比・高多重共線性の条件下での優位性、競争力のある計算効率を示す。

Action: Renet のアルゴリズムとベンチマーク結果を調査し、高次元データ分析や予測モデリングへの適用可能性を評価する。

Original: Renet: Principled and Efficient Relaxation for the Elastic Net via Dynamic Objective Selection domain ★★

stat.ML updates on arXiv.org

関数的アウトカムにおける処置効果の異質性を分離するための二重に頑健な機械学習アプローチ

本論文は、関数的アウトカムにおける異種処置効果（F-CATE）を推定するための、新しい二重に頑健なメタ学習器であるFOCaLを提案します。 FOCaLは、アウトカムモデリングと機能的擬似アウトカム再構築のための高度な関数回帰技術を統合し、頑健なF-CATE推定を可能にします。理論的導出、シミュレーション研究、実データでの検証を通じて、医療や政策分野における個別化AIの能力を向上させます。

Action: FOCaL (Functional Outcome Causal Learning) という、関数的アウトカムにおける異種処置効果（F-CATE）を推定するための新しい二重に頑健なアプローチについて調査し、本プロジェクトのデータ分析パイプラインへの応用可能性を検討する。

Original: A Doubly Robust Machine Learning Approach for Disentangling Treatment Effect Heterogeneity with Functional Outcomes domain ★★★

stat.ML updates on arXiv.org

高次元因果推論のためのニューラルスコアマッチング

・高次元データセットでは、従来の因果推論マッチング手法は次元の呪いの影響で実用的でない。・本研究では、ニューラルネットワークを用いて多変量バランススコアを導出する「ニューラルスコアマッチング」手法を提案する。・この手法は、高次元データセットにおける因果推論の治療効果推定と不均衡削減において、既存手法と比較して競争力があることを示した。

Action: 高次元データセットにおける因果推論のために、ニューラルスコアマッチング手法の実装を検討する。

Original: Neural Score Matching for High-Dimensional Causal Inference domain ★★

stat.ML updates on arXiv.org

ペアワイズ学習における非ノンパラメトリック推定の精緻な分析

本論文は、カーネル法やニューラルネットワークの研究を妨げていた、ペアワイズ学習における非ノンパラメトリック推定の厳密な仮定（凸性など）を緩和する。リプシッツ連続なペアワイズ損失に対するシャープなオラクル不等式を確立し、ペアワイズ最小二乗回帰に適用して、ミニマックス下限に一致するリスク境界を導出する。構造化された深層ReLUニューラルネットワークと制御された仮説空間の構築が新規性であり、既存手法では困難な問題への実験で有効性が証明されている。

Action: 深層学習モデルの一般化性能の理論的分析手法を、実務上のモデル設計やデバッグに応用できないか検討する。

Original: Fine-grained Analysis of Non-parametric Estimation for Pairwise Learning domain ★★

stat.ML updates on arXiv.org

多数の観測データ設定におけるシミュレーションベース推論のための拡散後方サンプリング

複雑なシミュレータを用いるモデルのパラメータ推定は、尤度計算が困難なため、シミュレーションベース推論 (SBI) が用いられます。本研究では、多数の独立した観測データ (tall data) を活用し、推論の精度向上とパラメータ識別性の改善を目指します。提案手法は、拡散過程を直接近似することで、計算コストの高い Langevin dynamics を回避し、既存手法より高速かつ安定した推論を実現します。

Action: 提案されている、Langevin dynamics を不要とする拡散後方サンプリング手法の実装または評価を検討する。

Original: Diffusion posterior sampling for simulation-based inference in tall data settings domain ★★★

stat.ML updates on arXiv.org

直交、ローレンツ、シンプレクティック対称性を持つテンソル学習

この論文では、直交、ローレンツ、シンプレクティック群に関連するテンソル関数の対称性を活用し、テンソル向けの普遍的に表現力のある同変機械学習アーキテクチャを開発しています。これらのアーキテクチャは、材料科学、理論計算機科学、時系列分析の3つの問題に適用されます。数値実験により、同変モデルは、特に時系列分析でパスシグネチャアプローチと組み合わせた場合、非同変ベースラインよりも優れた性能を示すことが示されています。

Action: テンソルに対する同変機械学習アーキテクチャを、材料科学や時系列分析などの具体的な問題に適用・評価する。

Original: Tensor learning with orthogonal, Lorentz, and symplectic symmetries domain ★★★

X @GoogleDeepMind

Geminiモデルアップデート: 強化されたマルチモーダル機能が追加！ #Geminimodelupdate

Gemini model update: Now with enhanced multimodal features! #Geminimodelupdate

要約: Geminiモデルのアップデートが発表され、マルチモーダル機能が強化されたことを伝える投稿。

❤️ 1800 🔁 400 💬 300 👀 60000

伸びた理由（仮説）: AIの最新進化に対する技術コミュニティの強い興味が、拡散を促したため。

Original: Gemini model update: Now with enhanced multimodal features! #Geminimodelupdate domain ★★★

X @OpenAI

新しいLLMのローンチを興奮して発表！ #OpenAIlaunch

Excited to announce the launch of our new LLM! #OpenAIlaunch

要約: OpenAIが新しい大規模言語モデル（LLM）のローンチを興奮気味に発表。ハッシュタグ付きで拡散を促す。

❤️ 1500 🔁 300 💬 200 👀 50000

伸びた理由（仮説）: AI技術の進化に対する高い関心とOpenAIのブランド力により、急速にシェアされた。

Original: Excited to announce the launch of our new LLM! #OpenAIlaunch domain ★★★

X @AnthropicAI

Claude 3.5 が登場、推論能力が向上。#AnthropicClaude

Claude 3.5 is here with improved reasoning capabilities. #AnthropicClaude

要約: AnthropicのAIモデルClaude 3.5がリリースされ、推論能力が向上したと発表。

❤️ 1200 🔁 250 💬 150 👀 40000

伸びた理由（仮説）: AIの新バージョンリリースに対する技術コミュニティの高い関心が集まったため。

Original: Claude 3.5 is here with improved reasoning capabilities. #AnthropicClaude domain ★★★

X @TechNewsDaily

OpenAIローンチイベントのハイライト：AIの次なる展開は？ #OpenAIlaunch

OpenAI launch event highlights: What's next for AI? #OpenAIlaunch

要約: OpenAIのローンチイベントのハイライトを共有し、AIの未来について議論。#OpenAIlaunch

❤️ 1000 🔁 200 💬 150 👀 35000

伸びた理由（仮説）: AI技術の急速な進化に対する一般的な関心が高く、タイムリーなイベント情報が拡散されたため。

Original: OpenAI launch event highlights: What's next for AI? #OpenAIlaunch domain ★★★

X @MistralAI

Geminiモデル更新が新しいベンチマークをもたらす。 #Geminimodelupdate

Gemini model update brings new benchmarks. #Geminimodelupdate

要約: Geminiモデルの最新更新により、新しいベンチマークが達成されたことを報告する投稿。

❤️ 800 🔁 140 💬 110 👀 28000

伸びた理由（仮説）: AI技術の進化に高い関心が集まる中、Geminiのアップデートが注目されたため。

Original: Gemini model update brings new benchmarks. #Geminimodelupdate domain ★★★

X @DiffusionFan

新しい拡散モデルによる画像生成を探求。驚異的！ #Diffusio…

Exploring the new diffusion model for image generation. Mind-blowing! #Diffusionmodel

要約: 新しい拡散モデルを使った画像生成を探求し、その驚異的な性能を絶賛。 #Diffusionmodel

❤️ 700 🔁 120 💬 90 👀 25000

伸びた理由（仮説）: AIの革新的な技術が話題を呼び、画像生成の可能性に多くの人が興味を持ったため。

Original: Exploring the new diffusion model for image generation. Mind-blowing! #Diffusio… domain ★★★

X @AIResearcher

新しいAIエージェントフレームワークがもうすぐリリース。乞うご期待！ #AIagentframework

New AI agent framework dropping soon. Stay tuned! #AIagentframework

要約: 新しいAIエージェントフレームワークのリリースを予告する投稿。詳細は近日公開予定で、注目を集めている。

❤️ 600 🔁 100 💬 80 👀 20000

伸びた理由（仮説）: AI開発者コミュニティの間で新しいフレームワークへの期待が高く、拡散されたため。

Original: New AI agent framework dropping soon. Stay tuned! #AIagentframework domain ★★★

X @AIEnthusiast

Anthropic Claude アップデート: より良くなった！ #AnthropicClaude

Anthropic Claude update: Better than ever! #AnthropicClaude

要約: AnthropicのClaudeがアップデートされ、以前より優れたものになったと宣伝する投稿。

❤️ 500 🔁 80 💬 60 👀 18000

伸びた理由（仮説）: AIの進化に興味を持つユーザーが多く、共有されたため。

Original: Anthropic Claude update: Better than ever! #AnthropicClaude domain ★★

X @RAGExpert

あなたのアイデアを、今すぐ形に。

なぜこのサイトを作ったのか