記事一覧

214ページ目 / 430ページ(全5152記事)

MiMo-Audio:オーディオ言語モデルのFew-Shot学習
AI/ML

MiMo-Audio:オーディオ言語モデルのFew-Shot学習

2025/9/19

XiaomiMiMo が公開する MiMo-Audio は,「Audio Language Models are Few-Shot Learners」を掲げるリポジトリで、オーディオと言語を結びつけるモデル設計や評価に関する技術資料とサンプル資産を含みます。音声特徴抽出からモデル評価までのワークフロー、技術報告書(PDF)やアセット類が同梱され、音声ベースの少量学習(few-shot)研究の出発点として利用可能です(リポジトリ自体は軽量で実装・説明資料中心)。

音声Few-Shotマルチモーダル
記事を読む
宣教師と食人族問題(Missionaries and Cannibals)
AI/ML

宣教師と食人族問題(Missionaries and Cannibals)

2025/9/19

Javaで実装された「宣教師と食人族(Missionaries and Cannibals)」問題の解法リポジトリ。VS Code向けのワークスペース構成を備え、srcにソース、binにコンパイル出力が作られる構成です。探索アルゴリズムを用いて安全な移送手順を導出する教育用・実験用の小規模プロジェクトです。(約300字)

Java探索教育
記事を読む
NeuSymEA — Neuro-Symbolic Entity Alignment の実装(NeurIPS25)
AI/ML

NeuSymEA — Neuro-Symbolic Entity Alignment の実装(NeurIPS25)

2025/9/19

NeuSymEA-NeurIPS25 は、NeurIPS25 論文「NeuSymEA: Neuro-symbolic Entity Alignment via Variational Inference」の公式実装です。ニューラル手法(例: LightEA 等の既存 Entity Alignment モデル)をベースに、シンボリックな制約・ルールを変分推論の枠組みで組み合わせることで、エンティティ整合(Entity Alignment)の精度とロバスト性を高めることを目的としています。サンプル実行スクリプトと最小限のデータ/設定が含まれ、再現実験や拡張研究の出発点になります。(約300字)

[Knowledge GraphEntity AlignmentVariational Inference]
記事を読む
OpenTrack(ヒューマノイド動作トラッキング)
AI/ML

OpenTrack(ヒューマノイド動作トラッキング)

2025/9/19

OpenTrackは、MuJoCoを用いたヒューマノイド動作トラッキングの公式実装です。GALBOT・清華大学による研究成果をベースに、シミュレーション環境やデータ生成ツール、Brax→PyTorch変換スクリプトなどを備え、マルチGPUでの学習や大規模実験に対応するコードベースを提供します。論文やデモサイトへのリンクが整備され、研究・実装の再現や拡張がしやすい構成になっています。(約300字)

roboticsmotion-trackingsimulation
記事を読む
Performance_Support:パフォーマンス支援ダッシュボード
Web

Performance_Support:パフォーマンス支援ダッシュボード

2025/9/19

パフォーマンス支援ダッシュボードは、チームや個人の業務パフォーマンスを可視化・分析するためのTypeScript製ダッシュボードプロジェクトです。データの集計・表示に特化したシンプルな構成で、開発や運用の現場で素早く導入できる設計を目指しています。軽量な依存関係とモジュール構造により、拡張やカスタマイズがしやすく、パフォーマンス指標のモニタリングや改善施策の可視化に役立ちます。

TypeScriptDashboardPerformance
記事を読む
腕立て伏せ検出器(Pushup-Detector)
AI/ML

腕立て伏せ検出器(Pushup-Detector)

2025/9/19

本リポジトリは、Webカメラ映像からリアルタイムに腕立て伏せ(プッシュアップ)を検出し、自動で回数をカウントするPythonプログラムです。MediaPipeを用いた姿勢推定で肘や肩の角度を計測し、角度の変化を閾値で判定して上下動を検出、視覚フィードバックを画面に描画します。軽量な構成でローカルのWebカメラだけで動作するため、トレーニングのセルフチェックやプロトタイプ実装に適しています。(約300字)

Computer VisionMediaPipePython
記事を読む
Qwen-Browser-plugin — ブラウザで画像逆解析と生成を行う拡張
AI/ML

Qwen-Browser-plugin — ブラウザで画像逆解析と生成を行う拡張

2025/9/19

本リポジトリは、ウェブページ上の任意の画像を右クリックして自動的に説明文(プロンプト)を生成し、そのプロンプトを使ってAIで新しい画像を生成するワークフローをブラウザ拡張として提供するツールです。画像解析→プロンプト生成→画像生成をシームレスに繋ぎ、生成結果はUI上で確認・保存できます。セットアップはローカルAPIキーや設定ファイルを用いる想定で、拡張本体はJavaScriptで実装されています。(約300字)

Browser ExtensionAIImage-Generation
記事を読む
SF-Express 返品用住所スクリーンショット生成テンプレート
Tool

SF-Express 返品用住所スクリーンショット生成テンプレート

2025/9/19

SF-Express(顺丰)など中国系配送業者の「返品用住所」スクリーンショットを手早く作れる、純HTMLのテンプレートリポジトリです。ブラウザやiOS/AndroidのファイルビューアでSFv3.htmlを開いて受取人情報を直接入力し、スクリーンショットを撮るだけで小程序やアプリにアップロード可能。JavaScriptを使わない設計でプライバシー保護と軽量性を両立し、JD/顺丰/STO/ZTOなど複数プラットフォームで利用できる汎用テンプレートを提供します。

SF-ExpressHTMLテンプレート
記事を読む
TDRM: 時間差分で滑らかにする報酬モデル(TDRM)
AI/ML

TDRM: 時間差分で滑らかにする報酬モデル(TDRM)

2025/9/19

TDRMは「Smooth Reward Models with Temporal Difference for LLM RL and Inference」という研究の実装リポジトリで、報酬モデル(Reward Model)学習に時間差分(Temporal Difference, TD)手法を導入することで、LLMを用いた強化学習(RL)や推論時スコアリングの安定化と滑らかさを狙います。本リポジトリは論文コード、設定ファイル、解析用スクリプトを含み、RLHFや報酬設計の実運用に向けた実装例を提供します。(約300字)

[RewardModelingReinforcementLearningLLM]
記事を読む
ToneShift — ウェブ上の文章をリアルタイムで最適化するChrome拡張
Web

ToneShift — ウェブ上の文章をリアルタイムで最適化するChrome拡張

2025/9/19

ToneShiftは、Chromeの組み込みAI機能を利用して任意のウェブページ上のテキストをリアルタイムに書き換え、読み手のニーズに合わせて「トーン(口調)」「複雑さ(難易度)」「簡潔さ(冗長さ)」を調整するChrome拡張です。ページ全体または選択テキストに対して即座に適用でき、ユーザーの設定を保存して再利用できます。シンプルなアーキテクチャでDOM操作とAI呼び出しを分離しており、プロトタイプとして軽量に設計されています。(約300字)

Chrome拡張AIテキスト変換
記事を読む
URLcatShortener — ターミナルで使えるシンプルなURL短縮ツール
Tool

URLcatShortener — ターミナルで使えるシンプルなURL短縮ツール

2025/9/19

URLcatShortenerは、端末(Termuxなど)から直接長いURLを短縮できる軽量なPython製CLIツールです。リポジトリは単一のスクリプト(URLcatShortener.py)とREADMEのみで構成され、インストール手順や使い方がREADMEに記載されています。追加ライブラリを最小限に抑え、素早くローカル環境からURL短縮を実行したい開発者やセキュリティ研究者、端末操作が好きなユーザー向けのツールです(約300字)。

URL短縮CLIPython
記事を読む
vishaka(ファイル配布ミラーと思しきリポジトリ)
Other

vishaka(ファイル配布ミラーと思しきリポジトリ)

2025/9/19

このリポジトリはソースコードではなく外部ダウンロードへのリンクと埋め込み画像を含む単一のREADMEのみを持つ「配布用」またはミラーページのように見えます。ファイル入手を目的としたリンク(upgit.org)が目立ちますが、内容やライセンス、目的の説明が欠如しており、信頼性や安全性の観点から注意が必要です。本稿では構成と技術的な見どころ、リスクと改善案を整理します。(約300字)

ファイル配布ミラー注意喚起
記事を読む