Awesome Pixel Flow — ピクセル空間拡散モデル論文集
2025/12/8
ピクセル空間(raw pixel)で動作する拡散モデルに特化した論文を系統的に収集したキュレーションリポジトリです。画像・映像生成を対象とし、潜在表現に依存しないエンドツーエンドのピクセル拡散手法を年代順に整理しています。最新のトランスフォーマーベース手法から古典的アプローチまでを網羅し、研究者や実装者の文献レビューや学習の起点として有用です(READMEのみで軽量な構成)。
19ページ目 / 405ページ(全4858記事)
2025/12/8
ピクセル空間(raw pixel)で動作する拡散モデルに特化した論文を系統的に収集したキュレーションリポジトリです。画像・映像生成を対象とし、潜在表現に依存しないエンドツーエンドのピクセル拡散手法を年代順に整理しています。最新のトランスフォーマーベース手法から古典的アプローチまでを網羅し、研究者や実装者の文献レビューや学習の起点として有用です(READMEのみで軽量な構成)。
2025/12/8
Vue 3 と Vite を使って作られたシンプルで美しい個人向けナビゲーション(ブックマーク)サイト。カテゴリ管理やカスタムお気に入りをサポートし、軽量な SPA 構成で静的ホスティングに適しています。元の「猫猫导航(mao_nav)」をベースにバグ修正と再構築を行ったフォークプロジェクトです。
2025/12/8
RocketSaverTool リポジトリは、現状では最小限の情報しか含まれていない「シンプルなプロジェクト入口」です。リポジトリ本体は README と画像アセット、連絡先(Telegram)へのリンクのみで構成され、実装ファイルや言語指定、ライセンス、ドキュメントが欠如しています。本記事では、現状の構成を整理し、技術的観点から得られる示唆と今後の改善案(構成例、CI/CD、パッケージ化、セキュリティ、ドキュメント方針など)を解説します。
2025/12/8
Bun 上で動く軽量なローカル「意味記憶」ライブラリ。Postgres を WASM 化した PGlite を組み合わせ、pgvector (HNSW) による本格的なベクトル検索を実現します。外部ベクトルDB不要でコレクション単位の整理が可能、AIエージェントやローカル検索用途に最適です。(約300字)
2025/12/8
イベントカメラにおけるレンズフレア除去を学習するためのツールキットです。本リポジトリは、イベントカメラ特有の出力(イベントストリーム)に対してレンズフレアを検出・除去する学習ベースの手法を提供します。ドキュメントやデモGIFを含み、英語・簡体中文のREADMEが用意されています。研究実装、データ準備、評価指標や実験設定を再現するための資料が整備されています。300字程度の説明。
2025/12/8
ターミナル上で動作するPHP製のサイバー調査風CLIゲーム「CodeStalker」。ネットワークスキャンや解析を模したインタラクティブな操作を通じて、ハッカー風の雰囲気を楽しめるエンタメ向けツールです。ゲーム性を重視した軽量な実装で、単一のPHPスクリプトとドキュメントから構成されており、ローカル環境のPHP(CLI)で手軽に起動して遊べます。実運用の攻撃ツールではなく学習/模擬体験用途を想定しています。
2025/12/8
DACompは「Benchmarking Data Agents across the Full Data Intelligence Lifecycle」を目的としたオープンソースのベンチマークスイートです。データ発見から前処理、変換、解析、可視化、パイプライン化までのデータインテリジェンス全工程に対して、"データエージェント"(自動化されたエージェント/モデル)の能力を体系的に評価するフレームワーク、タスクセット、評価基準、およびデータセットを提供します。再現性のある評価と拡張性を重視し、研究者や実務者がエージェント設計や比較検証を行えるように設計されています。(約300字)
2025/12/8
Editorial AIは、機械的な「AIが書いた」印象を抑えて、人間らしい文体・トーンへと文章を整えるためのオープンソーステンプレートです。React/TypeScriptとTailwind CSSで構築され、Google Gemini APIを用いた深層推論で「AIらしさ」の検出と修正候補を提示。分割画面のエディタやトーン調整、デプロイ手順やバックエンド設計案を含み、実運用を見据えた実装ガイドが揃っています(約300字)。
2025/12/8
Phone Agent を核とする Open-AutoGLM は、AutoGLM をベースにした「スマホ端末上の自動化アシスタント」フレームワークです。ADB(Android Debug Bridge)経由で実機を操作し、視覚言語モデルで画面内容を多モーダルに理解、意図解析と行動計画を組み合わせてユーザーの自然言語要求を自動実行します。ログインや認証などの敏感操作は確認や人手による引き継ぎが可能で、リモートADBデバッグもサポートします(開発初期段階のリポジトリ、サンプル実装中心)。今後の拡張でモバイルUX自動化やRPA用途に応用できます。
2025/12/7
SwiftUI と WKWebView を組み合わせた、iOS/macOS 向けの軽量な教育用可視化クライアントです。大規模モデルが生成する HTML を全画面でレンダリングし、OpenRouter の SSE を使ったストリーミング生成、ヒストリ管理、ローカル JSON による永続化、ダークテーマ対応の WebView ラップなどを備えています。シンプルな UI と最小限の設定で実験的なビジュアライゼーションを手軽に試せます。
2025/12/7
シンプルなブラウザ向けミニゲーム「Blue Ball Game」を収めたリポジトリ。HTMLと少量のスタイル/スクリプトで完結するキャンバスベースのアニメーションゲームで、レスポンシブな描画、タッチやマウスの入力処理、物理的なボールの挙動(跳ね返りや慣性)を備えています。軽量で学習用やデモ用に適した構成です。
2025/12/7
luhcli は Rust 向けのシンプルでエルゴノミックな CLI ライブラリです。最小限の設定でコマンドライン引数の定義、パース、ヘルプ表示を行えるよう設計されており、軽量ながら実用的な API を提供します。ドキュメントや crates.io での配布が整えられており、小〜中規模の CLI ツール開発に適しています(約300字)。