Data

致理_postgres_星期日のデータ管理リポジトリ

致理_postgres_星期日のデータ管理リポジトリ

2025/6/29

本リポジトリ「__2025_06_29_chihlee_postgres__」は、PostgreSQLに関連するデータ管理や操作を目的としたツール群やスクリプトをまとめています。中国語名「致理_postgres_星期日」からもわかるように、週末に集中したデータ処理やメンテナンス作業の効率化を狙った設計が特徴です。シンプルながら実用的な構成で、PostgreSQLを利用する開発者やDB管理者に有益なリソースを提供しています。

PostgreSQLデータ管理スクリプトメンテナンス
記事を読む
1KL データベース集 v2

1KL データベース集 v2

2025/10/2

1KL-bazy-danychv2 は、個別の CSV ファイル群として整理されたデータコレクションです。主に人名や関連するテキストデータを含む複数の CSV ファイル(合計33ファイル)で構成され、軽量なデータセットとして探索・解析・マージ・クリーニング用途に向いています。メタ情報は最小限で言語指定がないため、汎用的な前処理が必要です。

datasetcsvnames
記事を読む
25FA_AI1904-ADY201m(AI/データサイエンス授業リポジトリ)

25FA_AI1904-ADY201m(AI/データサイエンス授業リポジトリ)

2025/9/9

学内コース用に作成された教材リポジトリ。ZoomやLMSの接続情報、シラバスや教材リストへのリンク、講義資料として想定される画像ファイルを収めており、授業運営・受講者向けのリソース参照を目的とした軽量なリポジトリです。ソースコードは含まれておらず、構成はREADMEと画像が中心のため、教材共有のトレーラー的役割を果たします(約300字)。

AIData-Science教材
記事を読む
電気自動車充電の習慣分析(SQL)

電気自動車充電の習慣分析(SQL)

2025/10/31

本リポジトリは、DataCampの入門プロジェクト「Analyzing Electric Vehicle Charging Habits」を元にしたJupyter Notebook形式の教材リポジトリです。集合住宅の管理者向けに、充電ステーションの利用履歴データをSQLで集計・可視化し、ピーク時間帯や頻度の傾向、ステーションごとの利用集中などを把握するための基本的な解析手法が示されています。学習用にまとめられたサンプルノートブックと参考画像を含み、SQLの基礎から実践的な分析ステップまで学べます(約300字)。

電気自動車SQLデータ分析
記事を読む
Google株の10年間のパフォーマンス分析ダッシュボード(2015–2024)

Google株の10年間のパフォーマンス分析ダッシュボード(2015–2024)

2025/7/26

本リポジトリは、Alphabet Inc.(Google)の2015年から2024年までの株価パフォーマンスを詳細に解析したプロジェクトです。価格動向、日次リターン、取引量、ボラティリティといった主要な金融指標を対象に、Tableauで構築したインタラクティブなダッシュボードを通じて、10年間にわたる株式の動きを可視化し、投資判断や市場理解に役立つ洞察を提供します。

株価分析データ可視化Tableau
記事を読む
航空会社顧客満足度分析

航空会社顧客満足度分析

2025/8/24

本リポジトリ「Airline_Customer_Satisfaction_Analytics」は、航空会社の顧客満足度に関するデータ分析プロジェクトです。顧客のアンケートデータを用いて、満足度に影響を与える要因を探索的データ分析(EDA)や可視化により明らかにし、航空サービス改善のための示唆を提供します。Jupyter Notebookを中心に構成され、実務的な分析手法と結果解釈が体系的にまとめられています。

データ分析顧客満足度航空業界
記事を読む
銀行マーケティングキャンペーン分析

銀行マーケティングキャンペーン分析

2025/7/25

本リポジトリは、銀行の定期預金キャンペーンに関する顧客データをSQLで分析し、Power BIを用いて視覚的にセグメンテーションや傾向を把握するプロジェクトです。顧客の行動や属性に基づき、有効なマーケティング施策を導き出すためのデータ処理とレポート作成が行われています。銀行業界におけるデータドリブンな顧客獲得戦略の構築に役立つ内容です。

マーケティング分析SQLPower BI
記事を読む
顧客満足度調査解析(AnalisisEncuentaSatisfaccionCliente)

顧客満足度調査解析(AnalisisEncuentaSatisfaccionCliente)

2025/10/11

CSV形式の調査データを読み込み、度数分布や代表値を計算し、円グラフ・パレート図・ヒストグラム(KDE付)などで可視化する、TkinterベースのGUIを備えたPythonプロジェクトです。plotnine(ggplot風)でモダンな図を生成し、教育用途や軽量な分析ワークフローに適した実装を提供します。(約300字)

Python可視化統計解析
記事を読む
arbitrage - イラン暗号通貨取引所向けリアルタイム裁定取引データ収集・分析ツールキット

arbitrage - イラン暗号通貨取引所向けリアルタイム裁定取引データ収集・分析ツールキット

2025/8/1

本リポジトリ「arbitrage」は、イランの複数の暗号通貨取引所からリアルタイムのオーダーブックデータを収集・分析し、裁定取引(アービトラージ)機会を検出するための総合的なツールキットです。JavaScriptで実装されており、データ収集から解析、可視化までの一連の処理をサポート。特にイラン市場に特化した設計で、独自の取引環境に対応した実用的なソリューションを提供します。

暗号通貨裁定取引データ収集JavaScript
記事を読む
Awesome Parquet:Parquetフォーマットに関する有用リソース集

Awesome Parquet:Parquetフォーマットに関する有用リソース集

2025/7/25

Apache Parquetフォーマットの活用に役立つライブラリやツール、ドキュメント、ブログ記事などを体系的にまとめたリポジトリです。JavaScript、Python、Rといった複数の言語に対応した実装例や関連リソースを一覧化し、Parquetの理解と活用を促進します。データエンジニアや分析者にとって必携の情報源として機能します。

Parquetデータフォーマットライブラリツール
記事を読む
Fresh Beats 向け BI プロジェクト(BI-project-for-Fresh-beats)

Fresh Beats 向け BI プロジェクト(BI-project-for-Fresh-beats)

2025/10/30

Fresh Beats のマーケティングおよびユーザーデモグラフィクス分析を目的とした BI プロジェクトリポジトリ。ユーザーデータ(Excel)やプロジェクトステータス報告(PDF)、最終レポートへのリンクを含み、初期のデータ提供と報告書によってマーケティング施策や顧客セグメンテーションの示唆を提供する構成です。本リポジトリはコード主体ではなく、データと報告により分析成果を共有する形式で、再現性のためのスクリプトやダッシュボードは含まれていません(改善余地あり)。300字程度でプロジェクトの目的と構成を簡潔に示します。

BIMarketingDemographics
記事を読む
buou_grid:高周波ASグリッド生成ツール

buou_grid:高周波ASグリッド生成ツール

2025/6/27

buou_gridは、高周波帯域に対応したAS(自律システム)グリッドを生成するPythonベースのツールです。ネットワーク解析や通信研究に特化し、高頻度データ処理に適したグリッド構造を効率的に構築できます。シンプルながら柔軟な設計で、ASネットワークの解析やシミュレーションに役立つ機能を備えています。

Pythonネットワーク解析ASグリッド高周波
記事を読む
CarbonFiberShockLoading:複合材料ロケットタンクのパラシュート開放ショック負荷解析

CarbonFiberShockLoading:複合材料ロケットタンクのパラシュート開放ショック負荷解析

2025/8/28

本リポジトリ「CarbonFiberShockLoading」は、複合材料製ロケットタンクにおけるパラシュート開放時の衝撃負荷を解析するMATLABプロジェクトです。飛行データから減速度を抽出し、パラシュート展開の挙動をインパルス曲線から導出、開放ショック係数の検証を行います。得られたショック負荷と内部圧力を積層応力モデルに組み込み、バルクヘッドや材料の破損リスク評価を行うエンドツーエンドの解析ワークフローを提供します。

ロケット工学複合材料衝撃負荷解析
記事を読む
CDCデータ処理自動化ツール(cdc-kaggle)

CDCデータ処理自動化ツール(cdc-kaggle)

2025/7/3

cdc-kaggleは、Kaggleからのデータセットを自動で取得し、異なるバージョン間の差分を抽出するChange Data Capture(CDC)ファイルを生成するPythonベースのツールです。最新の2つのデータセットを比較して変更点を検出し、CSV形式で保存します。データのバージョン管理や差分分析を手軽に実現でき、データサイエンスやETL処理の効率化に役立ちます。

Change Data CaptureKagglePython
記事を読む
CMAQ EQUATESデータの行列座標を緯度経度に変換するツール

CMAQ EQUATESデータの行列座標を緯度経度に変換するツール

2025/7/28

本リポジトリは、大気環境モデルCMAQのEQUATESデータセットにおける行・列座標をWGS84の緯度経度座標に変換するための実用的なツール群を提供します。PythonとRのスクリプトを用いて、データのダウンロード、特定層・時刻の抽出、地理空間データへの変換、そしてggplot2による可視化までをカバー。大気汚染物質NO2の空間分布解析など、環境データ解析に有用なリポジトリです。

大気環境モデルデータ変換可視化
記事を読む
CNPJデータパイプライン:ブラジル法人番号データの効率的処理基盤

CNPJデータパイプライン:ブラジル法人番号データの効率的処理基盤

2025/6/15

cnpj-data-pipelineは、ブラジルの法人番号(CNPJ)に関する大規模データを効率的に収集、処理、管理するためのPythonベースのデータパイプラインプロジェクトです。法人情報の分析や活用を目的としたデータエンジニアリング基盤として設計されており、データ整形や更新処理を自動化することで、信頼性の高い最新情報の維持を実現します。

データパイプラインPythonデータエンジニアリング
記事を読む
コンクリート強度・橋梁状態評価・構造安定性モデリング

コンクリート強度・橋梁状態評価・構造安定性モデリング

2025/7/18

本リポジトリは、土木工学の教育課題として作成されたデータサイエンスと構造工学の統合的な解析プロジェクトです。Pythonを用いてコンクリートの強度評価、橋梁の状態評価、構造の安定性モデリングを実施し、現実世界の土木問題に対する理解と技術習得を目的としています。データ処理から可視化、オブジェクト指向プログラミングまで幅広くカバーし、実践的なエンジニアリング情報処理のスキルを養成します。

土木工学データサイエンスPython構造解析
記事を読む
COVID-19 データ解析と幸福度の相関

COVID-19 データ解析と幸福度の相関

2025/9/17

PythonとJupyter Notebookを用いてCOVID-19の公的データを前処理・可視化し、感染・死亡・回復の時系列トレンドを分析するとともに、各国の「幸福度(happiness index)」との関係性を探るプロジェクトです。データクリーニング、記述統計、時系列可視化を中心に、結果をノートブック形式で再現可能にまとめています。初心者から中級者がEAD(探索的データ解析)と可視化の実践例として参照できる構成です。

COVID-19データ分析可視化
記事を読む
Binance暗号資産市場データ集

Binance暗号資産市場データ集

2025/9/3

Binance取引所から収集された主要暗号資産ペア(USDT建て)の過去OHLCVデータを網羅したリポジトリです。2021年1月から2025年8月までのデータが複数の時間足(1分足、3分足、5分足、15分足など)で整理されており、量的分析やトレーディング戦略開発に最適です。データは使いやすいCSV形式で提供され、多様な分析ニーズに対応します。

暗号資産Binance市場データOHLCV時系列分析
記事を読む
CsSqlite — 高速かつ軽量なSQLiteバインディング (.NET/Unity)

CsSqlite — 高速かつ軽量なSQLiteバインディング (.NET/Unity)

2025/9/23

CsSqliteは、.NETおよびUnity向けに設計された極めて高速で堅牢、かつ軽量なSQLiteバインディングです。ネイティブのC実装をベースにし、パフォーマンス重視の設計、最小限のランタイムオーバーヘッド、AOT/IL2CPPやクロスプラットフォームへの対応を意識した作りになっています。ベンチマークやNuGet配布、ライセンスはMITで公開されており、簡潔なAPIと低レベル制御の両立を目指したプロジェクトです(300字程度)。

SQLite.NETUnity
記事を読む
Pythonで作るインタラクティブなダッシュボード

Pythonで作るインタラクティブなダッシュボード

2025/8/20

本リポジトリ「dashboard-python」は、Pandas、Streamlit、Plotly Expressを用いて作成された学習目的のインタラクティブダッシュボードです。売上データを可視化し、データ分析の基礎からダッシュボード構築までを実践的に学べる構成となっています。Pythonのデータ可視化とWebアプリケーション開発に興味がある方に最適な教材です。

Pythonダッシュボードデータ可視化
記事を読む
マンチェスター・ユナイテッドにおけるルーベン・アモリムのデータ分析(2025-26シーズン)

マンチェスター・ユナイテッドにおけるルーベン・アモリムのデータ分析(2025-26シーズン)

2025/9/4

本リポジトリは、2025-26シーズンにマンチェスター・ユナイテッドの監督を務めるルーベン・アモリムの戦術的特徴や課題をデータ分析により明らかにしたものです。特にゴール前の決定力不足、プレッシングの弱点、戦術の再構築といったテーマに焦点を当て、Jupyter Notebookを用いて詳細な解析を行っています。サッカー戦術の理解やチーム改善のヒントを得たい方に有用な資料です。

サッカー分析データサイエンス戦術解析
記事を読む
Data-Cleaning-Toolkit(データクリーニング・ツールキット)

Data-Cleaning-Toolkit(データクリーニング・ツールキット)

2025/10/9

データクリーニング用の軽量なツールキットをC++で提供するリポジトリ。散逸したデータや前処理が必要なデータセットに対して、基本的な整形・欠損値処理・フォーマット変換などを行うスクリプト群や関数群を意図しており、データサイエンスや機械学習プロジェクトの前処理工程を補助することを目的としています。本リポジトリはシンプルな構成で、サンプル実装となるソースコードが含まれています。コア機能の拡張や独自処理の追加がしやすい設計が想定されています。(約300字)

データクリーニングC++ツールキット
記事を読む
データエンジニア ロードマップ(Data Engineer Roadmap)

データエンジニア ロードマップ(Data Engineer Roadmap)

2025/10/25

Data Engineering の学習ロードマップをまとめたリポジトリ。チュートリアル、コース、エンドツーエンドのプロジェクト、認定試験や面接対策など、実務で役立つ学習リソースを体系的に収集しています。コード主体ではなくリンク集・学習ガイドとして初心者から中級者がキャリア構築する際の道標を提供します。(約300字)

データエンジニアロードマップ学習資源
記事を読む
Data-Project(データプロジェクト)

Data-Project(データプロジェクト)

2025/10/11

このリポジトリは「imdb film analysis」を含むシンプルなJupyter Notebookベースのデータ分析プロジェクトです。IMDBに関する映画データの読み込み、前処理、探索的解析、可視化を行うことを想定したノートブック群を収めており、データ分析のワークフローを学ぶための入門的な構成になっています。ドキュメントは最小限でコミット数も少なく、再現環境や追加のメタデータは限定的です(改善点も明示します)。 (約300字)

データ分析JupyterIMDB
記事を読む
DataAnalysis の日本語タイトル

DataAnalysis の日本語タイトル

2025/9/15

DataAnalysis は Bo-growing による Jupyter Notebook ベースのデータ処理/解析リポジトリです。タイトルが示す通り「AT2-DataAnalysis-DataProcessing-WithHugeOutputs」を目的とし、大量出力を伴うデータ前処理や解析のワークフローをノートブック形式で記録しています。サンプルノートブックと簡潔な README を含み、学習用やプロトタイプ検証に適した構成になっています。

データ分析JupyterPython
記事を読む
PostgreSQLとInterBaseの配列型フィールドを扱うサンプルプロジェクト

PostgreSQLとInterBaseの配列型フィールドを扱うサンプルプロジェクト

2025/7/25

本リポジトリは、PostgreSQLおよびInterBaseにおける配列型フィールドの使用例を示すサンプルコードを提供しています。Pascal言語を用い、データベースの配列データ処理の実装方法を解説。AI生成のフェイク指紋データを用いたデモも含まれ、配列型を用いた高度なデータ管理の理解を深めることが可能です。

PostgreSQLInterBasePascal配列型データベース
記事を読む
db_arrray_test:PostgreSQLとInterBaseの配列フィールド操作サンプル

db_arrray_test:PostgreSQLとInterBaseの配列フィールド操作サンプル

2025/7/25

本リポジトリ「db_arrray_test」は、PostgreSQLおよびInterBaseにおける配列型フィールドの読み書きを解説するブログ記事に付随するサンプルコードを提供しています。Pascal言語で実装されており、データベースの配列型データを効率的に扱う方法を学べる実践的なリソースです。PostgreSQLやInterBaseの配列型の取り扱いに興味がある開発者に最適な内容となっています。

PostgreSQLInterBasePascal配列型データベース
記事を読む
DBMSL — SPPU DBMS 実習コード集

DBMSL — SPPU DBMS 実習コード集

2025/11/8

SPPU(Savitribai Phule Pune University)のComputer Engineering向けDBMSL実習(2019パターン)をまとめたリポジトリ。SQLのDDL/DML/JOIN演習、MapReduceの課題、JavaとMongoDBを用いたNoSQL接続例など、データベース設計・操作から分散処理まで学べる実務的な実習ファイル群を収録しています。学生の学習用や入門者のハンズオン教材として有用です(約300字)。

DBMSSQLMongoDB
記事を読む
部門別給与分析ダッシュボード

部門別給与分析ダッシュボード

2025/7/17

本リポジトリは、Celebal TechnologiesのSQLインターンシップ最終課題として作成された、StreamlitとPower BIを用いた部門別給与分析のダッシュボードです。従業員と部門の給与データを可視化し、平均給与が全体平均を上回る部門を強調表示することで、給与分布の傾向や課題を簡単に把握できます。Pythonベースで開発されており、データの生表示からグラフ化まで幅広く対応しています。

給与分析データ可視化StreamlitPower BI
記事を読む
ウェブ上の表データ読み取りチャレンジ

ウェブ上の表データ読み取りチャレンジ

2025/7/15

本リポジトリは、ウェブページ上に存在する表形式のデータをPythonのJupyter Notebook環境で効率的に取得・解析する手法に挑戦したものです。主にPandasライブラリを活用し、HTMLテーブルの読み込みからデータの整形までを実演。データサイエンスやスクレイピング入門者に向け、実践的なコード例を通じてウェブデータの活用方法を分かりやすく示しています。

PythonPandasWeb Scraping
記事を読む
ダイヤモンド価格分析プロジェクト

ダイヤモンド価格分析プロジェクト

2025/8/1

本リポジトリは、50,000点以上のダイヤモンドの価格および物理的特徴を含む「Diamonds」データセットを対象にした探索的データ分析(EDA)プロジェクトです。データの前処理から可視化、相関分析までを通じて、ダイヤモンドの価格に影響を与える主要な要因を明らかにします。カラット数、カット、色、透明度などの特徴と価格との関係を多角的に検証し、価格決定要素の理解を深めることを目的としています。

EDAダイヤモンド価格データ分析
記事を読む
DreamV:低コードデータ可視化プラットフォーム

DreamV:低コードデータ可視化プラットフォーム

2025/8/11

DreamVは、専門知識の異なるユーザーでも簡単にプロフェッショナルレベルのデータ可視化ダッシュボードを構築できる低コードのデータ可視化プラットフォームです。ドラッグ&ドロップによる直感的なUI設計、多様なレイアウト機能、豊富なコンポーネント群を備え、政府や企業のニーズに応え、開発工数の削減と迅速なアプリケーション提供を実現します。

データ可視化低コードJavaScript
記事を読む
DuckLake RubyによるSQLデータベースとオブジェクトストレージを活用したデータレイク構築

DuckLake RubyによるSQLデータベースとオブジェクトストレージを活用したデータレイク構築

2025/8/18

DuckLake Rubyは、SQLデータベースとファイル/オブジェクトストレージを組み合わせて、自身のデータレイクを構築・運用できるRubyクライアントライブラリです。PostgreSQLやS3互換ストレージを利用し、柔軟に分散データを管理・分析する基盤を提供します。まだ本番環境向けではありませんが、DuckDBと連携した次世代のデータレイクソリューションとして注目を集めています。

データレイクRubySQLオブジェクトストレージ
記事を読む
エッジ確率グラフモデル:エッジ独立性を超えて

エッジ確率グラフモデル:エッジ独立性を超えて

2025/9/5

「Edge Probability Graph Models Beyond Edge Independency」は、従来のエッジ独立性仮定を超えた新しいエッジ確率グラフモデルに関する研究の実装リポジトリです。本リポジトリでは、論文の補遺、コード、およびデータが提供されており、複雑な依存関係をもつグラフ構造のモデリングと解析を可能にします。Pythonで実装されており、グラフ生成や解析アルゴリズムの基盤が整備されているため、研究者やエンジニアが応用・拡張しやすい内容となっています。

グラフ理論確率モデルデータマイニング
記事を読む
Edgeworth_0DTE:0DTEオプションのエッジワース展開による価格付け

Edgeworth_0DTE:0DTEオプションのエッジワース展開による価格付け

2025/8/23

本リポジトリ「Edgeworth_0DTE」は、Bandiらによる0DTE(当日満期)オプションの価格付け手法を実装しています。基礎となる金融資産の特性関数を小時間のエッジワース級数展開で表現し、ほぼガウス分布を前提にしつつ、非対称性や極端な裾野(ファットテール)を修正項として加えることで、短期オプションの価格を精緻に計算可能です。Jupyter Notebook形式で、理論的背景から計算例までを示し、短期オプション価格のモデリングに興味がある研究者や実務家に有用な実装となっています。

金融工学オプション価格付けエッジワース展開
記事を読む
投票所(Station 66)ジオコーディングプロジェクト

投票所(Station 66)ジオコーディングプロジェクト

2025/9/21

タイの投票所(選挙単位)の緯度経度をボランティアで収集し、オープンデータとして整備することを目的としたリポジトリです。CSVデータのクレンジングとバッチジオコーディングを行うPythonスクリプトや関連画像を含み、地図表示や分析、選挙準備に使える位置情報データの公開を目指しています。(約300字)

選挙ジオコーディングオープンデータ
記事を読む
病院待ち時間分析ダッシュボード – Excelプロジェクト

病院待ち時間分析ダッシュボード – Excelプロジェクト

2025/8/2

本リポジトリは、病院における患者の待ち時間を詳細に分析し、Excelで可視化したダッシュボードを提供します。財務クラスや医師タイプなどのカテゴリー別に待ち時間を分布分析し、どのセグメントで遅延が多いかを明確に示すことを目的としています。シンプルながらも効果的なフィルター機能や視覚的なグラフを用い、医療現場の課題把握と改善に役立つツールとして活用可能です。

Excelデータ分析病院可視化
記事を読む
AI・テックスタートアップ求人データセット

AI・テックスタートアップ求人データセット

2025/8/6

本リポジトリは、114社以上のトップAI・テック企業における932件以上のエンジニアリング職の求人情報を日々自動更新で収集・提供するオープンデータセットです。AI分野のスタートアップやテック企業での最新求人動向を把握でき、データ分析やキャリア研究に活用可能です。

AIスタートアップ求人データ
記事を読む
飲料水アクセスデータ分析プロジェクト:データ理解と統合

飲料水アクセスデータ分析プロジェクト:データ理解と統合

2025/8/5

本リポジトリは、WHO/UNICEF合同モニタリングプログラム(JMP)が2020年に公開した飲料水アクセスデータを用い、Googleスプレッドシートでのデータクレンジングや構造化、分析を行うプロジェクトです。生データのインポート問題の解決や計算フィールドの追加を経て、都市・農村別の飲料水利用状況を把握し、基礎的飲料水サービスの現状を総合的に理解することを目的としています。

飲料水データ分析Googleスプレッドシート
記事を読む
geometry - 幾何学的関係データベース

geometry - 幾何学的関係データベース

2025/6/25

「geometry」はPythonで開発された幾何学的関係データベースで、幾何学的オブジェクト間の関係性を体系的に管理・利用できるツールです。研究や教育、応用数学の分野での利用を想定しており、幾何学的概念をコードベースで扱う際の利便性を高めることを目的としています。リポジトリはシンプルながらも拡張性を持ち、幾何学に関するデータ処理や分析をサポートします。

幾何学データベースPython
記事を読む
GM-CDRP:腸内細菌群と慢性疾患研究プログラム

GM-CDRP:腸内細菌群と慢性疾患研究プログラム

2025/6/17

GM-CDRP(Gut Microbiota Chronic Disease Research Program)は、2010年以降に蓄積された腸内細菌群と関連する慢性疾患のコホートデータを収集・解析する研究プロジェクトです。糖尿病、非アルコール性脂肪肝炎、慢性炎症性腸疾患、関節リウマチ、冠動脈疾患、高血圧、心房細動、脳卒中など多岐にわたる疾患と腸内微生物の関連性を明らかにすることを目的としています。データベースの構築を通じて、疾患の予防や治療に資する知見の創出を目指しています。

腸内細菌群慢性疾患コホート研究
記事を読む
GoPie - 自然言語でデータ探索を可能にするAI対応データベースプラットフォーム

GoPie - 自然言語でデータ探索を可能にするAI対応データベースプラットフォーム

2025/8/22

GoPieは、技術的な専門知識がなくても利用できるオープンソースの自然言語データ探索プラットフォームです。ユーザーがデータセットを高速かつAI対応のデータベースに変換し、自動生成されたAPIを通じてデータ操作を可能にします。Docker Composeを利用したセットアップが可能で、PostgresやRedisなどのサービスと連携し効率的なデータ管理を実現します。

自然言語処理データベースAITypeScript
記事を読む
GoStore - Go言語で実装したシンプルなRedis互換キーバリューストア

GoStore - Go言語で実装したシンプルなRedis互換キーバリューストア

2025/8/28

GoStoreはGo言語でゼロから実装されたRedisライクなシンプルなインメモリキーバリューストアです。基本的なSETやGETなどのコマンドをTCP上で扱え、RESPプロトコルに対応。さらにAOF(Append Only File)による永続化も備えています。軽量かつスレッドセーフで、Redisの基本動作を学習・検証したい開発者に最適なリポジトリです。

GoキーバリューストアRedis互換
記事を読む
hentaivid:文化的コンプライアンスを重視した映像ストレージシステム

hentaivid:文化的コンプライアンスを重視した映像ストレージシステム

2025/6/8

hentaividは、文化的規制に準拠したビデオストレージシステムであり、映像データにテキストチャンクを埋め込むことで高速な意味検索を実現します。データベースを用いずに、メディアファイル自体に情報を内包させることで、プライバシー保護とコンプライアンスを最大化した設計が特徴です。Pythonで実装され、軽量かつ効率的な検索基盤を提供します。

ビデオ検索文化的コンプライアンスセマンティック検索
記事を読む
データベースインデックス最適化ガイド:インデックスを無効化する表現の回避法

データベースインデックス最適化ガイド:インデックスを無効化する表現の回避法

2025/8/24

本リポジトリは、SQLクエリのパフォーマンスを著しく低下させる「インデックスを無効化する表現(index defeating expressions)」に焦点を当てた包括的な最適化ガイドです。PostgreSQL、MySQL、SQL Serverなど主要データベースで発生しやすい20の代表的なアンチパターンを解説し、効率的なクエリ作成や機能的インデックスの活用法を実例付きで紹介します。これにより、開発者は実践的な知見を得て、データベースの高速化を図れます。

SQL最適化データベースインデックスパフォーマンスチューニング
記事を読む
世代間知恵運動の実装ロードマップ

世代間知恵運動の実装ロードマップ

2025/8/3

「Intergenerational Wisdom Movement」は、世代を超えた知恵を記録・共有し、未来の崩壊を防ぐためのデータ駆動型リポジトリ構築プロジェクトです。高齢者との対話を通じて得られた生きた知見を抽出し、分散型のレジリエンスを育むことを目指しています。Planetary Restoration Archiveの一部として、環境・社会の持続可能性に貢献する取り組みです。

世代間知恵持続可能性データ駆動レジリエンス
記事を読む
Investic Orderflow(オーダーフロー解析)

Investic Orderflow(オーダーフロー解析)

2025/9/13

Investic Orderflowは、オーダーフロー(取引板・約定情報)を基にしたマイクロ構造解析やグリッド型トレーディング戦略のプロトタイピングを目的としたリポジトリです。Jupyter Notebook中心に可視化・ゾーン設計・マイクログリッド解析のワークフローを提供し、最終的にシンプルなグリッドボット実装(grid_bot.py)へとつなげる構成になっています。トレード戦略の設計・検証・視覚化を手軽に始めたいクオンツや個人トレーダー向けの素材群です。

オーダーフロー可視化トレーディング
記事を読む
IRMV-Medical-Dataset:内視鏡手術向け三次元視覚データセット

IRMV-Medical-Dataset:内視鏡手術向け三次元視覚データセット

2025/7/3

IRMV-Medical-Datasetは、内視鏡手術シーンに特化した高品質な三次元視覚データセットです。点群、深度画像、カメラ姿勢、キャリブレーションパラメータなどの幾何情報を豊富に含み、視覚SLAM、構造光3D再構築、カメラキャリブレーション検証、幾何学学習、手術ナビゲーションアルゴリズムの評価など、多様な医療ロボット分野の研究開発を支援します。これにより、複雑な手術環境下でのロボットの自主感知・定位能力向上に貢献することを目的としています。

医療データセット内視鏡画像3Dビジョン
記事を読む
JulianaTeam — Juliana Gimoliecaの作業リポジトリ

JulianaTeam — Juliana Gimoliecaの作業リポジトリ

2025/11/1

JulianaTeamは、Juliana Gimoliecaさんの学習・作業用ノートをまとめたリポジトリです。Jupyter Notebookを中心に、Pythonの基礎(データ型やループ)、データ処理のワークシート(Excelファイル)やプロジェクト用ノートブックが含まれており、初学者がPythonでデータを読み込み・処理・解析する流れを学べる構成になっています。学習履歴やサンプルコードの共有に適したシンプルな構成です(300字程度)。

DataPythonJupyter
記事を読む
Koukouと仲間たち:散户支援の数理経済モデル

Koukouと仲間たち:散户支援の数理経済モデル

2025/9/24

本リポジトリは「散户情绪与股市变化成正相关」を掲げ、個人投資家(散户)を支援するための数理経済モデル実装を試みた小規模プロジェクトです。主要スクリプトはPythonで記述され、過去のGME株価データを読み込んでボラティリティ推定、オプション価格算出や借券料・維持保証金を考慮したポジション評価と可視化を行うことを意図しています。データや追加ドキュメントは含まれておらず拡張余地があります。

データ金融モデリング
記事を読む
港株オプション大口取引監視システム

港株オプション大口取引監視システム

2025/9/5

本リポジトリはFutu OpenD APIを活用し、香港株のオプション大口取引をリアルタイムで監視・分析するシステムを提供します。大口取引の売買方向やオプション種類を自動判別し、取引量の変化を検知して通知。企業向けWeChatロボットやMac通知、Webインターフェースといった多様なチャネルで情報を配信し、効率的な投資判断を支援します。定期的なデータ更新や株価キャッシュ機能により、パフォーマンスも最適化されています。

株式市場オプション取引リアルタイム監視
記事を読む
LatticeDB-NextGen-DBMS:次世代の時間軸対応リレーショナルデータベース

LatticeDB-NextGen-DBMS:次世代の時間軸対応リレーショナルデータベース

2025/9/6

LatticeDB-NextGen-DBMSは、マージ可能なCRDTテーブル、タイムトラベルクエリ、ベクトル検索、差分プライバシーを標準搭載した次世代のリレーショナルデータベース管理システムです。C++17で書かれており、SQLエンジン、Write-Ahead Logging(WAL)ストレージ、そしてモダンなWebベースGUIを備え、マルチマスター環境での競合なしデータ管理やプライバシー保護分析を実現します。

リレーショナルデータベースCRDTタイムトラベルクエリ差分プライバシー
記事を読む
MCP + SQL Server フェイクデータ (.NET 10 dnx + Docker Compose) テスト集

MCP + SQL Server フェイクデータ (.NET 10 dnx + Docker Compose) テスト集

2025/9/26

本リポジトリは、SQL Server 用の MCP(Managed Code Packages)テストとフェイクデータ生成用MCP群を組み合わせ、.NET 10 の dnx ツールチェーンと Docker Compose を使って動作検証を行うサンプル集です。サンプルは小規模ながら、SQL Server の拡張機能テスト、フェイクデータ投入、Visual Studio Code との連携イメージを含み、コンテナ環境での簡易検証や学習用途に適しています。設定例と画像付きデモで構成を素早く理解できます。(約300字)

タグ1タグ2タグ3
記事を読む
MCP / VSCode Dev Days 2025-09 資料(mcp-vscode-dev-days-2025-09-spcapital)

MCP / VSCode Dev Days 2025-09 資料(mcp-vscode-dev-days-2025-09-spcapital)

2025/9/27

2025年9月27日に行われた「MCP(Microsoft Certification Program)」に関する発表資料をまとめたリポジトリです。スライド類が中心で、SQL Server向けのMCPやデモ用のフェイクデータ生成に関する参照リンクが含まれます。軽量なプレゼン資料リポジトリで、発表準備や学習用のリファレンスとして利用できます(ポルトガル語のコンテンツが含まれる点に注意)。

MCPVSCodePresentation
記事を読む
Medhansh_Medishettyのデータ分析ポートフォリオ

Medhansh_Medishettyのデータ分析ポートフォリオ

2025/7/28

本リポジトリは、NIT Warangalの最終学年生であるMedhansh Medishetty氏が、SQLやPower BI、Pythonなどを用いて実際のデータから洞察を得る能力を示したデータ分析およびダッシュボード作成のプロジェクト集です。販売分析や配達インサイトなど、多様な実務的課題に取り組んだ成果がまとめられており、データ分析の学習者や実務者にとって貴重な参考資料となっています。

データ分析Power BIPython
記事を読む
メディアデータベース - CS50 SQL最終プロジェクト

メディアデータベース - CS50 SQL最終プロジェクト

2025/9/3

本リポジトリは、CS50のSQL最終プロジェクトとして作成された正規化されたメディアデータベースです。映画、シリーズ、アニメ、ドキュメンタリーなどの多様なメディアコンテンツを管理し、ユーザーのコメントや視聴履歴、サブスクリプションタイプといったインタラクション情報も追跡します。メディアストリーミングプラットフォームやコンテンツ分析、レコメンデーションエンジンのバックエンド構築に適したスケーラブルな設計が特徴です。

SQLデータベース設計メディア管理
記事を読む
MeuSQL - SQL学習リポジトリ

MeuSQL - SQL学習リポジトリ

2025/8/22

「MeuSQL」は、SQLの学習を目的としたシンプルなリポジトリです。SQLの基本的なコマンドやクエリの使い方をファイルにまとめており、初心者がSQLの基礎を理解しやすい構成となっています。実践的なSQL文の例や解説を通じて、データベース操作の基本を身につけることができます。

SQL学習データベース
記事を読む
MOCR-DB:遺伝的因果解析向けデータ・コードリポジトリ

MOCR-DB:遺伝的因果解析向けデータ・コードリポジトリ

2025/9/17

MOCR-DBは、Mendelian randomization(MR)解析や関連する遺伝統計解析のためのデータとコードを整理したリポジトリです。コアとなるRスクリプト群(データ前処理、MR向け関数、Shinyインターフェース)を提供し、外部ホストされた処理済みサマリーデータ(MR結果、LDSCなど)を参照する構成です。再現性と解析の可視化を兼ね備え、研究ワークフローの基盤として利用できます。(約300字)

MendelianRandomizationRGenomics
記事を読む
MoonTV ソース集 (moontv-source)

MoonTV ソース集 (moontv-source)

2025/11/2

このリポジトリはインターネット上のビデオ/ライブ配信ソースを集め、JSON形式の設定ファイルとして公開する軽量な「動画ソース共有」プロジェクトです。メインのconfig.json(READMEではconfig-all.jsonとして案内)を通じて購読リンクを提供し、自動更新をONにすれば最新の利用可能な動画ソースを定期的に受け取れます。成人向けコンテンツは別ファイルで分離されており、用途に応じて必要な設定だけを取り込める設計です(約300字)。

ビデオストリーミングサブスクリプション
記事を読む
multigres - Postgres向けのVitess実装

multigres - Postgres向けのVitess実装

2025/6/10

multigresは、Googleが開発した大規模MySQLクラスタ管理システムであるVitessのPostgreSQL対応版を目指すオープンソースプロジェクトです。Postgresのスケーラビリティや高可用性を実現しつつ、Vitessの優れた分散データベース管理機能を活用できることを目的としています。現状はまだ発展途上ながら、Postgresの水平分割やクラスタリング構成に関心のある開発者に注目されています。

PostgreSQLVitess分散データベース
記事を読む
MySQL to Doris データ同期システム(mysqltodoris)

MySQL to Doris データ同期システム(mysqltodoris)

2025/10/10

MySQLからApache Dorisへ大規模データを移行・同期するためのオープンソースツール。Python/Flaskで構築されたWeb管理画面を備え、リアルタイム監視、スマートキュー、バッチ最適化、自動テーブル生成や接続リカバリのパッチなど実運用を想定した機能を提供します。スケーラビリティと障害耐性を重視した設計で、ETL負荷の軽減と安定したデータパイプライン運用を支援します。(約300字)

データ移行MySQLApacheDoris
記事を読む
NoF1 コンバージョン分析(nof1-conversions-analyze)

NoF1 コンバージョン分析(nof1-conversions-analyze)

2025/11/5

AIトレーディング競技での6つのAIモデルの暗号通貨取引戦略を深掘りする静的分析リポジトリ。バックテスト結果や可視化レポートをHTMLベースで提供し、成功要因・失敗要因の抽出、モデル間比較、取引指標(損益、ドローダウン、シャープレシオ等)の解析にフォーカスしています。オンライン版が公開されており、レポート出力やアセットを含む構成です(約300字)。

AITradingAnalysis
記事を読む
한입 기사 데이터 엔지니어링パイプライン

한입 기사 데이터 엔지니어링パイプライン

2025/8/12

한입 기사(OBA: One Bite Article) 데이터 엔지니어링 레포지토리는 사용자 뉴스 소비 및 퀴즈 풀이 데이터를 기반으로 Kafka, Spark, Airflow 등 최신 빅데이터 기술을 활용해 자동 수집, 정제, 저장, 분석이 가능한 실시간 데이터 파이프라인을 구축하는 프로젝트입니다。실시간 로그 수집부터 데이터 전처리, 저장, 시각화까지 전 과정을 자동화하여 효율적인 데이터 관리와 분석을 지원합니다。

[データパイプラインKafkaSparkAirflow]
記事を読む
Opensearch解析ケースの自動化ツール

Opensearch解析ケースの自動化ツール

2025/8/1

本リポジトリは、Opensearchを活用した解析ケースの自動化を目的としたPython製ツールです。スーパーでの食品選択をユーザーの食事制限と予算に応じて自動で最適化する機能を備えています。Docker環境でのセットアップが可能で、実際のデータパースから解析までの一連の流れを効率的に処理します。データ解析や検索エンジン技術を活用したプロジェクトに最適です。

Opensearchデータ解析Python自動化
記事を読む
メンズ香水eコマース売上分析

メンズ香水eコマース売上分析

2025/10/2

eBayマーケットプレイス上のメンズ香水販売データを対象に、売上・価格・ブランド別パフォーマンスを解析するリポジトリ。売上総額や販売数、価格セグメント(Budget〜Luxury)といったビジネスメトリクスの算出、ブランドのランキングと効率スコア、可視化によるインサイト抽出を通じて、Eコマース運営の最適化に資する分析手法を示します(約300字)。

データ分析EコマースPython
記事を読む
pg_lake — Iceberg とデータレイク対応の PostgreSQL 拡張

pg_lake — Iceberg とデータレイク対応の PostgreSQL 拡張

2025/11/4

pg_lake は PostgreSQL に Iceberg テーブルとオブジェクトストア上のデータファイル(例: S3)の直接アクセスを統合する拡張です。Postgres のトランザクションとクエリ最適化を活かして Iceberg のテーブル作成・変更、メタデータ管理、そして Parquet/CSV 等の生データファイル読み取りを一貫して行えます。ローカル Postgres をそのまま軽量な lakehouse として利用できる点が特徴です。(約300字)

[DataPostgreSQLIceberg]
記事を読む
Power BI プロジェクト集(DATA 320)

Power BI プロジェクト集(DATA 320)

2025/7/19

本リポジトリは、Power BIを用いて作成されたデータ分析プロジェクトのコレクションです。主にデータの品質レポート作成に焦点を当てており、学術的な課題や実務的な分析に役立つ資料が含まれています。初心者から中級者までPower BIの活用方法を学べる構成となっており、データ可視化やレポート作成の実践例が豊富です。

Power BIデータ分析データ品質
記事を読む
Power BI ダッシュボード — 投資とメディア分析(powerbi-investimentos-midias)

Power BI ダッシュボード — 投資とメディア分析(powerbi-investimentos-midias)

2025/10/21

Power BI Desktopで作成された、Meta Ads・TikTok Ads・YouTube Adsなどの有料メディア投資を可視化するダッシュボードリポジトリ。キャンペーン別・チャネル別の投資効率(CPA/ROAS/CPC等)や配分、期間比較、パフォーマンス傾向をインタラクティブに分析できる構成で、サンプルデータや画像、ドキュメントが含まれる。マーケティング投資の最適化や社内レポート基盤のプロトタイプとして活用可能。

Power BIデータ可視化マーケティング
記事を読む
Practice-Pandas:Pandas練習コード集

Practice-Pandas:Pandas練習コード集

2025/6/25

「Practice-Pandas」は、Pythonのデータ分析ライブラリであるPandasの練習用コードを網羅的にまとめたリポジトリです。初心者から中級者まで、Pandasの基本操作から応用的なデータ処理まで幅広く学べるように設計されており、実践的なサンプルコードで理解を深められます。データ分析のスキルアップを目指す方に最適なリソースです。

PythonPandasデータ分析
記事を読む
前立腺がん解析ダッシュボード

前立腺がん解析ダッシュボード

2025/7/31

本リポジトリ「Prostate-Cancer-Analysis」は、前立腺がんのリスク評価と分析に特化したデータ駆動型プロジェクトです。Pythonのデータサイエンスツールを用いて、患者データの可視化や統計解析を行い、医療現場に役立つインサイトを提供します。Streamlitによるインタラクティブなダッシュボードを備え、専門知識がなくてもデータを直感的に理解可能です。教育や研究、臨床支援に適したツールとして活用できます。

前立腺がんデータ分析PythonStreamlit
記事を読む
PROYECTO-YT-TRENDS:メキシコYouTubeトレンド動画の探索的分析プロジェクト

PROYECTO-YT-TRENDS:メキシコYouTubeトレンド動画の探索的分析プロジェクト

2025/7/25

PROYECTO-YT-TRENDSは、PythonとYouTube Data API v3を活用し、メキシコのYouTubeトレンド動画を対象にした探索的データ分析プロジェクトです。動画の視聴傾向や人気カテゴリ、ユーザーエンゲージメントの指標を可視化し、トレンド動画の特徴や視聴者の行動パターンを明らかにします。統計的手法による分析とAPIを用いたデータ収集により、YouTubeの動向理解を深める実践的な内容となっています。

YouTubeデータ分析Python
記事を読む
python-programs — Python 練習問題と解答集

python-programs — Python 練習問題と解答集

2025/11/7

Python の基礎から OOP、NumPy、Pandas、データ可視化までを扱う学習向けリポジトリ。番号付きの短いスクリプト群で各トピックの典型的な問題と解法を示しており、配列操作やインデクシング、Series/DataFrame の変換、リスト化など入門~中級者向けのハンズオン学習に適しています。サンプルコードは実行しやすく、学習教材やリファレンスとして活用可能です。

PythonNumPyPandas
記事を読む
Queryflare:安全でスケーラブルな従量課金型データベース

Queryflare:安全でスケーラブルな従量課金型データベース

2025/6/12

Queryflareは、TypeScriptで実装された安全かつスケーラブルな従量課金型データベースシステムです。ユーザーはクエリごとに課金される仕組みで、効率的なリソース管理とコスト最適化を実現。セキュリティと拡張性を重視し、クラウド環境に適した設計となっています。開発者が柔軟に利用できるよう設計されており、特に大規模データ処理やAPI経由のデータアクセスで威力を発揮します。

データベーススケーラビリティセキュリティ
記事を読む
工場機械監視のためのリアルタイムIoTデータパイプライン

工場機械監視のためのリアルタイムIoTデータパイプライン

2025/9/15

本リポジトリは、工場に設置されたIoTセンサーからのデータをリアルタイムで収集・処理・分析するためのデータパイプラインに関する資料と実装例を提供します。目的は予知保全や稼働状況の可視化を支援し、アラートやダッシュボードを通じて運用効率を向上させることです。設計ドキュメントと実装報告(PDF)を含み、データ取り込みからストリーム処理、解析フローの設計指針を学べます。(約300字)

IoTReal-TimeData-Pipeline
記事を読む
RedisCache:高性能データ処理のための適応型キャッシュプラットフォーム

RedisCache:高性能データ処理のための適応型キャッシュプラットフォーム

2025/9/6

RedisCacheは、動的なRedisキャッシュノードを活用し、高性能かつ耐障害性のあるデータ処理を実現する適応型キャッシュプラットフォームです。リアルタイムのデータ生成と消費のギャップを効率的に埋め、低遅延でのデータアクセスを可能にします。Pythonで実装され、シンプルながら柔軟な設計により、幅広いアプリケーションでの高速キャッシュ戦略を支援します。

RedisキャッシュPython
記事を読む
Rust チーター データパイプライン

Rust チーター データパイプライン

2025/10/24

Rust(ゲーム)で報告された不正プレイヤーのSteamプロフィールを定期的にスクレイピングしてデータベース化するPython製のデータパイプライン。AirflowのDAGやデータベース構築用のスクリプトを含み、データ収集・蓄積・管理を自動化する構成が取られている。リリースやコードスタイル(black)も整備されており、解析・可視化やアカウント追跡のための基盤として利用できる。

RustDataPipelineWebScraping
記事を読む
SAR-SoMoist:SARと受動マイクロ波を用いた高解像度土壌水分推定ソフトウェア

SAR-SoMoist:SARと受動マイクロ波を用いた高解像度土壌水分推定ソフトウェア

2025/7/13

SAR-SoMoistは、合成開口レーダー(SAR)と受動マイクロ波リモートセンシングデータを活用した高解像度の土壌水分推定およびマッピングを目的とした統合ソフトウェアです。ユーザーフレンドリーなGUIを備え、データのインポート、疑似カラー表示、土壌水分の反演、時間変化解析などを簡便に実行可能。農業や水資源管理、環境モニタリングに貢献する先進的なツールとして注目されています。

土壌水分SARリモートセンシング
記事を読む
NYCのAirbnbリスティング分析のためのスケーラブルデータパイプライン

NYCのAirbnbリスティング分析のためのスケーラブルデータパイプライン

2025/9/15

本リポジトリは、ニューヨーク市のAirbnbリスティングに関する分析を目的としたスケーラブルなデータパイプラインの設計・実装資料をまとめたプロジェクトです。自動データ収集、データクレンジング、変換、分析までをカバーするアーキテクチャ説明と実装ドキュメントが含まれ、拡張性や再現性、運用監視を考慮した設計が示されています(資料はPDFで提供)。データ解析に必要な前処理や集約、特徴量生成の方針も解説しています。

DataPipelineAirbnb
記事を読む
スコット・マクトミネイ:ポジショニング&プレー可視化マップ(Manchester United vs Napoli)

スコット・マクトミネイ:ポジショニング&プレー可視化マップ(Manchester United vs Napoli)

2025/9/21

Scott McTominayのマンチェスター・ユナイテッド在籍時とナポリでのシーズンを比較するための可視化スクリプト集です。ピッチ上のポジショニングマップ、シュート・ゴールマップ、ドリブル(キャリー品質)マップ、そしてプログレッシブパス&ランのマップを生成し、戦術記事やプレゼン用に高解像度で出力できます。再現可能なデータ駆動型レポート作成を想定したJupyter Notebook中心の構成です(約300字)。

サッカー可視化Python
記事を読む
seq-db:高性能ログ管理データベース

seq-db:高性能ログ管理データベース

2025/7/18

seq-dbは、ログの保存と高速クエリに特化したスケーラブルで高性能なデータベースです。単一インスタンスからクラスタ構成まで柔軟に対応し、大量のログデータを効率的に扱えます。Go言語で実装されており、拡張性と可用性を重視した設計が特徴です。開発者向けにシンプルなクイックスタートガイドや詳細なアーキテクチャドキュメントも提供されています。

ログ管理データベースGo
記事を読む
SGS(Smart Growth Solutions)レストラン向けデータ分析ツール

SGS(Smart Growth Solutions)レストラン向けデータ分析ツール

2025/9/21

Smart Growth Solutions(SGS)は、レストランなどのリテール向けデータを手早く分析するための軽量なPythonツールです。Excelやデータベースファイルを読み込み、単一コマンドで20以上の詳細な指標やトレンド分析、店舗比較、機会発見などを自動生成します。自動型判定やパフォーマンススコアリング機能を備え、SQLの知識がなくても強力な洞察を得られる点が特徴です。(約300字)

DataPythonAnalytics
記事を読む
SIVEA_scripts:気象データ自動処理スクリプト集

SIVEA_scripts:気象データ自動処理スクリプト集

2025/7/31

SIVEA_scriptsは、自動気象観測所から取得される生データのダウンロード、処理、保存を自動化するPythonスクリプト群です。本リポジトリは、気象データの可視化システムSIVEAへの統合を容易にすることを目的としており、データの取得からクリーニング、検証まで一連の作業を効率化します。データ処理の自動化により、気象研究や環境モニタリングの効率向上に寄与します。

気象データ自動化Python
記事を読む
スマートマーケットインサイト(Smart Market Insights)

スマートマーケットインサイト(Smart Market Insights)

2025/7/24

Smart Market Insights(SMI)は、モバイルデバイスを活用して地元のトレーダーが在庫管理や価格設定を賢く行えるよう支援するデータプロジェクトです。基本的なデータ分析やAIツールを用いて、販売動向の把握や効率的な意思決定を実現。Google SheetsやDatawrapper、ChatGPTなどのツールを組み合わせ、実用的かつアクセスしやすい形で市場インサイトを提供します。

データ分析AIマーケットインサイト
記事を読む
SolanaのTPS計測ツール

SolanaのTPS計測ツール

2025/7/18

本リポジトリはSolanaブロックチェーン上のトランザクション処理速度(TPS: Transactions Per Second)を計測するRust製のツールです。指定した過去の時間範囲内におけるブロックを取得し、平均TPSを算出します。Voteトランザクションは除外されるため、実際の取引処理能力を正確に把握できます。Solanaのパフォーマンス解析やブロックチェーン研究に有用なリソースです。

[SolanaTPS計測Rustブロックチェーン]
記事を読む
Solana開発者データ収集ツールの紹介

Solana開発者データ収集ツールの紹介

2025/7/10

本リポジトリは、Solanaエコシステムにおける開発者数を把握するためのGitHubクローラーのサンプル実装です。Solana関連のリポジトリや活動をGitHub上から収集し、PostgreSQLデータベースに保存。Solana開発者コミュニティの規模や動向を分析する基盤を提供します。JavaScriptで記述されており、実践的なデータ収集の例として活用可能です。

SolanaGitHubクローラー開発者データ
記事を読む
Sonar-rs:Solanaブロックチェーン向け高性能インデックス&解析プラットフォーム

Sonar-rs:Solanaブロックチェーン向け高性能インデックス&解析プラットフォーム

2025/8/7

Sonar-rsは、Solanaブロックチェーンのオンチェーン活動、特にトークンスワップや流動性プールに焦点を当てた高性能でモジュール化されたインデックス&解析プラットフォームです。SolanaのGeyserプラグインと直接連携し、低遅延でリアルタイムのデータ収集を実現。機能別に独立したクレート構成でスケーラブルな設計を採用し、APIやスケジューリングなど各サービスを柔軟に運用可能。Rustで実装され、安全かつ高速な処理を実現しています。

SolanaブロックチェーンRustインデックスデータ解析
記事を読む
S&P 500 ローリングリターンと収束分析ツール

S&P 500 ローリングリターンと収束分析ツール

2025/8/12

「sp500-convergence」は、Pythonで実装されたS&P 500の長期ローリングリターンと収束指標を分析するためのCLIツールです。自動でSlickChartsから年間トータルリターンデータを取得し、CSVファイルの柔軟な取り込みや多様な基準値設定が可能。投資分析や市場収束の理解に役立つ機能を備えています。

Python投資分析データ解析
記事を読む
spell-assetsのInkwell Spellsデータセット

spell-assetsのInkwell Spellsデータセット

2025/7/27

「spell-assets」は、1,179種類の魔法エフェクトを収録したInkwell Spellsデータセットです。Retro DiffusionというAI生成技術で作成されたスプライトシートやGIFアニメーション、プロンプト、テキスト埋め込み情報など、多様な素材を一括で提供。ゲーム開発やクリエイティブ制作に活用しやすい形で整理されており、オープンソースとして自由に利用可能です。

ゲーム開発AI生成画像素材
記事を読む
Google AnalyticsデータをBigQueryのSQLで解析するEコマース分析プロジェクト

Google AnalyticsデータをBigQueryのSQLで解析するEコマース分析プロジェクト

2025/8/17

本リポジトリは、Googleの公開しているGoogle Analytics 360のサンプルデータセットをBigQuery上でSQLにより解析し、マーケティングやプロダクト、成長チーム向けに実用的なインサイトを抽出する方法を示しています。技術的・非技術的ユーザー双方に理解しやすい解説を目指し、Eコマースデータのユーザーセッションやトランザクション解析を通じて、データドリブンな意思決定を支援します。

BigQuerySQLGoogle AnalyticsEコマースデータ分析
記事を読む
SQL Server MCPスクリプトの活用例

SQL Server MCPスクリプトの活用例

2025/7/29

本リポジトリは、コンテナ化されたSQL Serverデータベースサーバー上でMCP(Model-Driven Code Processor)を利用し、ブラジルの地域データをクエリする具体例を示しています。Visual Studio Codeの設定ファイルmcp.jsonを活用し、T-SQLを用いて効率的にデータ処理を行うスクリプト群を提供。SQL Serverの最新技術を活用した開発や運用の実践的な参考となります。

SQL ServerMCPコンテナ化T-SQL
記事を読む
SSIS・Power BI・Microsoft BIを活用したデータパイプラインデモ

SSIS・Power BI・Microsoft BIを活用したデータパイプラインデモ

2025/7/12

本リポジトリは、Microsoft BIスタックを活用したリテール向けBIソリューションのデモを提供します。Power BIのデータモデリング、SSIS・SSRSによるETL・レポーティング、T-SQLの最適化、CI/CDパイプラインの実装、データ品質チェックのフレームワークなど、エンドツーエンドのデータパイプライン構築に必要な技術要素を体系的に学べる内容となっています。Azure DevOpsを用いた自動デプロイ環境も含まれており、実践的なMicrosoft BIの活用例として有用です。

Power BISSISMicrosoft BIデータパイプラインCI/CD
記事を読む
Streamlitによる大規模アプリケーションインスタンス監視ダッシュボード

Streamlitによる大規模アプリケーションインスタンス監視ダッシュボード

2025/8/28

本リポジトリは、PythonとStreamlitを用いて構築された大規模アプリケーションインスタンスの監視・分析ダッシュボードです。SQLiteによるデータ管理とPandasによるデータ処理を組み合わせ、数千にも及ぶインスタンスの自動データ収集と高速な可視化を実現。シンプルなUIでリアルタイムの状況把握やトラブルシューティングを容易にします。

StreamlitPythonアプリケーション監視データ可視化
記事を読む
学生の成功分析(Student Success Analysis)

学生の成功分析(Student Success Analysis)

2025/9/18

学生の学習成果を統計的手法で解析し、理解と改善のための洞察を提供するプロジェクト。コースで扱われる統計解析手法を適用し、仮説検定・回帰分析・可視化を通じて学業成績や関連要因の関係を明らかにします。最終報告はPDFでまとめられ、R言語を用いた再現可能な解析ワークフローを含みます(約300字)。

DataStatisticsR
記事を読む
DuocUC 2025 データベース演習リポジトリ

DuocUC 2025 データベース演習リポジトリ

2025/8/20

本リポジトリは、チリのDuocUC Puerto Monttキャンパスの「Taller de Bases de Datos(データベース演習)」コース、2025年セクション1Vの学生による共同作業の成果物をまとめたものです。基本的なデータベース設計や管理を学びながら、チームでの実践的な取り組みを行うことを目的としています。READMEには学生たちの簡単な自己紹介も含まれており、今後の開発や学習の土台として活用されるリポジトリです。

データベース学習リポジトリDuocUC
記事を読む
Telegram-Scraper:Telegramチャンネルからのメッセージ&メディア収集ツール

Telegram-Scraper:Telegramチャンネルからのメッセージ&メディア収集ツール

2025/6/17

Telegram-Scraperは、Python製の強力なスクリプトで、Telethonライブラリを利用してTelegramチャンネルからメッセージやメディアをスクレイピングできます。リアルタイムでの連続収集、メディアの自動ダウンロード、そして収集データの多様な形式でのエクスポートを特徴とし、効率的かつ柔軟なデータ取得を実現します。

TelegramスクレイピングPython
記事を読む
TheLab-workspace:汎用アイデア創出とプロジェクト初期化のランチパッド

TheLab-workspace:汎用アイデア創出とプロジェクト初期化のランチパッド

2025/7/16

「TheLab-workspace」は、PowerShellをベースにした汎用的なアイデア発想およびプロジェクトの初期化支援ツール群を提供するリポジトリです。Azure Cosmos DBを利用したTypeScriptサンプルの統合や、開発環境のコンテナ化設定を含み、効率的な開発開始をサポートします。多彩な設定ファイルやスクリプトで構成されており、開発者のワークスペース構築を加速させることが可能です。

PowerShellAzureプロジェクト初期化
記事を読む
Xómデータ図書館 - 無料で公開されたデータ学習資料集

Xómデータ図書館 - 無料で公開されたデータ学習資料集

2025/7/25

「thu_vien_cua_xom_data」は、データサイエンスやデータ分析を学ぶ人々向けに、基礎から応用まで幅広い書籍や資料を無料で公開しているリポジトリです。学術資料からデータの可視化、問題解決力を養う教材まで多彩なコンテンツが揃っており、データ業界の初心者からプロフェッショナルまで活用できます。ベトナム語中心ながら、公開形式でコミュニティに貢献する貴重なリソースです。

データサイエンスデータ分析無料資料
記事を読む
TradeLens:グローバル貿易パターンと経済開発の可視化ダッシュボード

TradeLens:グローバル貿易パターンと経済開発の可視化ダッシュボード

2025/7/4

TradeLensは、200以上の国における国別の経済発展と購買行動の相関を分析・可視化するインタラクティブなダッシュボードです。DataCo GlobalのサプライチェーンデータセットやWorld GeoData 2023などの複数データを用い、コロプレスマップやパラレル座標プロットなど多彩なビジュアライゼーションでグローバルな貿易動向を直感的に把握できます。TypeScriptで開発され、拡張性とメンテナンス性に優れた設計が特徴です。

グローバル貿易データ可視化TypeScript
記事を読む
交通事故档案管理システム

交通事故档案管理システム

2025/6/15

「TrafficAccidentFileManagementSystem」は、交通事故に関する档案(ファイル)を効率的に管理するためのシステムであり、卒業設計のソースコードとして公開されています。事故データの整理、検索、編集などの基本機能を備え、交通事故関連の情報管理を簡便に行うことが可能です。管理業務の効率化とデータの一元管理を目指した設計となっています。

交通事故管理ファイル管理卒業設計
記事を読む
txwd_record:Tencent Docsオンライン表格解析ツール

txwd_record:Tencent Docsオンライン表格解析ツール

2025/7/17

txwd_recordは、APIを必要とせずにTencent Docs(腾讯文档)のオンライン表格をPythonで解析するツールです。前端のレンダリングデータを解析し、表格の内容をpandasのDataFrame形式に変換することで、データの取得・分析・加工を容易にします。複雑なAPI認証やスクレイピングの煩雑さを排除し、シンプルかつ高精度なデータ抽出を実現しています。

Pythonデータ解析Tencent Docs
記事を読む
NASA Mission Control for Unfolded Circleの日本語解説

NASA Mission Control for Unfolded Circleの日本語解説

2025/8/22

本リポジトリは、Unfolded Circle Remote 2/3デバイス向けにNASAの各種ライブデータフィードを統合するPythonベースのプロジェクトです。天文画像、国際宇宙ステーション(ISS)の位置情報、地球の衛星画像、宇宙天気情報などをリアルタイムで取得し、デバイス上で表示可能にします。NASAのミッションデータを手軽に活用できる点が特徴です。

NASA宇宙データPython
記事を読む
UKリテール合成データ生成デモ

UKリテール合成データ生成デモ

2025/8/11

本リポジトリは、英国の小売取引データセットを用いてリアルでプライバシー保護された合成データを生成するデモプロジェクトです。小売、EC、金融、サプライチェーンなどの業界で、実データの代替としてテストや分析、機械学習に活用できる合成データの作成手法を紹介しています。実世界のタブラー(表形式)データを基に、個人情報を保護しつつも統計的性質を維持したデータ生成を実現しており、データサイエンティストやエンジニアに有用なリソースとなっています。

合成データ小売データデータ生成
記事を読む
車両シルエットの教師なしクラスタリング解析

車両シルエットの教師なしクラスタリング解析

2025/8/28

本リポジトリは、車両の幾何学的シルエットデータに対して、正規化と主成分分析(PCA)を用い、K-MeansやDBSCANなどのクラスタリング手法でセグメンテーション解析を行うパイプラインを提供します。データのクリーニングから検証、クラスタリング、評価までを再現可能な形で実装し、性能評価やデータの妥当性確認に重点を置いています。Pythonの主要ライブラリを利用し、車両の形状分類に役立つ手法の検証を目的とした研究開発を支援します。

クラスタリングPCA車両解析
記事を読む
US労働経済:ACSデータによる所得と労働参加の分析

US労働経済:ACSデータによる所得と労働参加の分析

2025/10/12

本リポジトリは、米国国勢調査のAmerican Community Survey(ACS)マイクロデータ(2021–2023年)を用いて、教育、性別、労働時間、地理的要因が所得と労働力参加に与える影響を探索するRベースの分析プロジェクトです。回帰分析や決定木などの統計・機械学習手法を適用し、特徴量エンジニアリングや可視化を通して説明変数の寄与を明らかにする再現可能なワークフローを提供します(約300字)。

RACS労働経済
記事を読む
Valorant Map Helper(ヴァロラント マップ ヘルパー)

Valorant Map Helper(ヴァロラント マップ ヘルパー)

2025/11/8

本リポジトリは「Valorant Community Preference Research」を題材にした教育用ドキュメントで、コミュニティの選好やマップ選択の傾向、ユーザー行動を学術的に分析するための資料を提供します。実データや解析コードは含まれておらず、研究設計や観察項目、教育目的での利用を想定したリファレンス的リポジトリです。(約300字)

Valorant分析リサーチ
記事を読む
ベンダーパフォーマンス分析 – 小売在庫と販売の効率化

ベンダーパフォーマンス分析 – 小売在庫と販売の効率化

2025/9/7

本リポジトリは、SQL、Python、Power BIを活用してベンダー(仕入先)のパフォーマンスを分析し、戦略的な購買および在庫管理の意思決定を支援するプロジェクトです。販売データや在庫情報を統合的に解析し、ベンダーごとの効率・収益性を評価。データクレンジングから可視化までの一連の工程を通じて、業務改善に役立つインサイトを提供します。分析結果はPDFレポートやダッシュボードで分かりやすく提示されており、小売業の購買担当者やデータ分析者に有用なリソースです。

データ分析SQLPythonPower BIベンダーマネジメント
記事を読む
VictoriaTraces:高性能な分散トレース収集・分析システム

VictoriaTraces:高性能な分散トレース収集・分析システム

2025/7/7

VictoriaTracesは、高速かつスケーラブルな分散トレースの収集と分析を目的としたオープンソースのソフトウェアです。Go言語で実装されており、軽量で効率的なトレースデータの処理を実現。マイクロサービス環境におけるパフォーマンス監視や障害解析を支援するため、柔軟なデータ取り込みと高度なクエリ機能を備えています。VictoriaMetricsファミリーの一員として、他の監視ツールとの連携も強力です。

分散トレーシングパフォーマンス監視Go言語
記事を読む
ビデオゲーム売上分析 (video-game-sales-analysis)

ビデオゲーム売上分析 (video-game-sales-analysis)

2025/10/12

PythonとSQL、可視化技術を用いて世界のビデオゲーム売上データを解析するプロジェクトです。ジャンル・プラットフォーム別の売上傾向、パブリッシャーの成功度、地域別の嗜好差の可視化や、機械学習を用いたゲームのグローバル売上予測まで取り扱います。Jupyter Notebook上でデータクリーニング、探索的解析(EDA)、集計、可視化、予測モデル構築の一連の流れを再現できる構成になっており、再現性のためのRequirements.txtや元データ(vgsales new.csv)を含みます(分析の学習・実務的な応用どちらにも適した内容です)。

データ分析Python可視化
記事を読む
Weather-Analysis-System — 気象解析システム

Weather-Analysis-System — 気象解析システム

2025/9/24

リアルタイム気象データ、衛星画像、モデル予報を統合して専門的な気象解析を支援するPythonベースのツール。National Weather ServiceやOpen‑Meteo、GOES‑16衛星データを利用し、Zulu時間でのモデル探索やアニメーション化された衛星画像表示などの機能を備えています。小規模リポジトリながら、気象データ収集・可視化の基本を押さえた構成です。(約300字)

気象データ分析Python
記事を読む
Airflowとdbtを活用したデータパイプライン構築ワークショップ

Airflowとdbtを活用したデータパイプライン構築ワークショップ

2025/5/31

本リポジトリは、PythonベースのAirflowとdbt(data build tool)を組み合わせてデータパイプラインを構築するためのワークショップ用教材です。Airflowによるワークフロー管理とdbtによるデータ変換を連携させる実践的なサンプルが含まれており、モダンなデータエンジニアリングの基礎を学べます。小規模ながらも実用的な構成で、データ処理の自動化や品質管理に興味がある開発者に最適です。

Airflowdbtデータパイプライン
記事を読む
YouTube Shorts & TikTok 2025 — EDAインサイト

YouTube Shorts & TikTok 2025 — EDAインサイト

2025/9/13

2025年のYouTube ShortsとTikTokの短尺動画トレンドを対象にした、入門向けの探索的データ解析(EDA)チュートリアルです。クリエイター、ハッシュタグ、視聴行動、プラットフォーム間の比較といった観点からデータの読み込み、前処理、可視化、集計手法を丁寧に解説するJupyter Notebookが中心で、分析の再現に必要なrequirements.txtとライセンスを含みます。初心者が短尺動画のトレンド分析のワークフローを学ぶのに適しています。

YouTubeTikTokEDA
記事を読む
zyx.data — Z/Y/X データソートユーティリティ

zyx.data — Z/Y/X データソートユーティリティ

2025/10/19

zyx.data は、"z y x" という列順に注目した軽量な Python ベースのデータユーティリティです。小規模なリポジトリ(ファイル数4、コミット数3)で、z 値を基準にした並べ替えやレポート出力を想定したシンプルな実装が含まれます。依存が少なく、コマンドラインやスクリプトから手早く使える設計が特徴で、CSV/テキスト系データの前処理や簡易解析に向きます(拡張やテスト追加が容易)。公的なライセンスファイルも同梱されています。

Pythonデータ処理ソート
記事を読む
demo-risk — OpenBBワークスペースによるポートフォリオ・リスク可視化デモ

demo-risk — OpenBBワークスペースによるポートフォリオ・リスク可視化デモ

2025/11/12

OpenBB Workspaceを利用したデモ用アプリケーションで、Fama–Frenchファクター分析を用いてサンプルポートフォリオが市場要因にどう反応するかを可視化します。サンプルデータは固定されていますが、ロジックチェーンに任意のモデルポートフォリオを組み込むことが可能で、ローカル実行やDocker/Flyでのデプロイを想定した構成になっています(Python 3.9〜3.12対応)。開発者がリスク要因の寄与やファクター感応度(ベータ)を理解・検証するための軽量なデモプロジェクトです。

FinanceRiskAnalysisOpenBB
記事を読む
不変の曲流—ダム規制が移動速度を抑えるが侵食の幾何学的テンプレートを保存する

不変の曲流—ダム規制が移動速度を抑えるが侵食の幾何学的テンプレートを保存する

2025/11/13

本リポジトリは論文「The Invariant Meander: Dam Regulation Suppresses Migration Rates but Conserves the Geometric Template of Erosion」の解析データと再現コードを収録しています。リモートセンシングから河道中心線と曲流の移動量を抽出し、LME(線形混合効果)モデル等の統計手法でダム規制の影響を評価。結果はダムが曲流の移動速度を低下させる一方で、侵食の空間的パターン(位相遅れ)という幾何学的テンプレートは保存されるという「デカップリング」を示しています。再現可能な解析パイプラインと図表生成スクリプトを提供します(約300字)。

[GeomorphologyRemoteSensingR]
記事を読む
タイムスタンププロトコルによるトランザクション・スケジューラのシミュレータ

タイムスタンププロトコルによるトランザクション・スケジューラのシミュレータ

2025/11/13

本リポジトリは、データベース授業向けの課題実装で、トランザクションの並行実行制御における「タイムスタンプ(timestamps)プロトコル」を模擬するシンプルなシミュレータをPythonで提供します。仮想環境で main.py を実行すると、与えたトランザクション操作列に基づく実行結果がテキストファイルに出力され、読み取り・書き込みの衝突判定や中止・許可処理のログが確認できます(実行ログ例も同梱)。教育用途やアルゴリズムの理解に適した小規模実装です。

データベースシミュレーションPython
記事を読む
Amazon株価分析(Amazon_Stock_Analysis)

Amazon株価分析(Amazon_Stock_Analysis)

2025/11/13

本リポジトリは、Pythonを用いてAmazon(AMZN)の株価データを取得し、探索的データ解析(EDA)と可視化を通じて株価の特徴やトレンドを明らかにすることを目的としたサンプルプロジェクトです。Yahoo Finance APIから実データを取得し、欠損値処理や特徴量エンジニアリング、移動平均やリターン計算といった金融時系列解析の基本的手法を実装。さらに可視化による洞察抽出と、機械学習の基礎(回帰モデルなど)を通じた予測アプローチの紹介を含み、データ分析のワークフロー全体を学べる構成になっています。(約300字)

株式分析PythonEDA
記事を読む
ICLR スコア解析ツール (iclr-score)

ICLR スコア解析ツール (iclr-score)

2025/11/13

OpenReview(例:ICLR)の投稿・レビュー評価(スコア)を取得して集計・可視化するためのコマンドラインツール群です。Pythonパッケージとして提供され、CLIサブコマンドで投稿取得、レビュー取得、統計計算、プロット作成、Primary Area(主領域)解析などを実行できます。認証情報はハードコードせず環境変数や引数で渡す設計で、実運用での機密情報漏洩リスクを低減しています。モジュール化によりノートブックやスクリプトから機能を再利用可能です(Python 3.10+ 推奨)。

タグ1タグ2タグ3
記事を読む
Olistの販売分析(Analise-Vendas-Olist)

Olistの販売分析(Analise-Vendas-Olist)

2025/11/14

ブラジル最大級のeコマースデータセット「Olist」を対象に行われた探索的データ解析(EDA)プロジェクトです。Jupyter Notebook上でPandasを使い、注文、配送、レビュー、売上に関するデータの統合・前処理・可視化を通じて販売パフォーマンス、配送遅延、地域別の売上傾向などを明らかにします。データ本体は含まれておらず、公開データセットを前提にした再現可能な分析ワークフローを提供します。(約300字)

EDAPandasMatplotlib
記事を読む
University Info Bot(大学情報ボット)

University Info Bot(大学情報ボット)

2025/11/16

Python製のTelegramボットで、USの主要なコンピュータサイエンス系大学のランキング、出願締切、教員情報をウェブからスクレイピングして集約・提供します。US NewsやCSRankingsなど複数ソースを組み合わせ、動的ページ対応のためChromedriverを用いる設計で、config.pyで設定を管理し、インタラクティブなチャット操作で情報取得が可能です。(約300字)

web-scrapingtelegram-botpython
記事を読む
Romosozumab治療の統計解析(Statistical analysis for Romosozumab treatment)

Romosozumab治療の統計解析(Statistical analysis for Romosozumab treatment)

2025/11/17

Romosozumab投与に伴う骨密度や有限要素解析(FE)で推定される骨強度の変化を、Pythonで作成されたカスタムスクリプトで解析するリポジトリです。主にDXAによる面密度(脊椎・股関節)、CTによる体積密度(大腿近位部・遠位部・脛骨近位部)、およびFE予測強度(大腿骨・脛骨)を、投与から12か月時点と24か月時点で比較し、中央値(IQR)を報告、対応のある非パラメトリック検定(Wilcoxon検定)を用いて群内変化を評価しています。解析再現性や可視化の拡張が期待される小規模なPythonベースの解析コード群です。

PythonBiostatisticsMedical
記事を読む
KVectors - オープンソース版ベクトルデータベース

KVectors - オープンソース版ベクトルデータベース

2025/11/17

KVectors は Scala(JVM)で実装されたオープンソースのベクトルデータベースです。Semantic Search を念頭に置いたベクトル格納と検索を目的とし、純粋な Java(正確には Scala 2.12)で動作するライブラリ/ストアとして提供されます。軽量で組み込みやすく、Maven ビルドやドキュメントが揃っているため、ローカル運用やカスタム拡張のベースとして利用可能です(約300字)。

ベクトル検索JVMScala
記事を読む
MiningTraffic — 仮想通貨マイニングのネットワークトラフィックデータ

MiningTraffic — 仮想通貨マイニングのネットワークトラフィックデータ

2025/11/17

仮想通貨マイニングに関するネットワークトラフィックのデータセットを収録したリポジトリです。50種類の仮想通貨(币种)に関するマイニング通信を対象にしたキャプチャや解析結果を含むことが想定され、研究や機械学習モデルの学習、トラフィック分類、ネットワークフォレンジックなどに活用できます。メタデータはJSON形式で管理され、解析済みデータのディレクトリも同梱されています(ライセンスや利用上の注意は要確認)。

マイニングネットワーク仮想通貨
記事を読む
CoT_data — Chain-of-Thought(CoT)実験用データと推論スクリプト

CoT_data — Chain-of-Thought(CoT)実験用データと推論スクリプト

2025/11/18

本リポジトリは、Chain-of-Thought(CoT)やプロンプト文脈の与え方が生成結果に与える影響を検証するための小規模データセットと推論コード、統計検定結果を含みます。experimental_phase1/phase2/control の区分や、追加文脈をどのタイミングで送るか(最初のメッセージ後/2回目のメッセージ後/送らない)を整理した summary.tsv や、複数のプロンプトテンプレート(context_prompt.txt、general_prompt1/2.txt)および推論を行う inference.py を中心に構成されており、CoT の文脈依存性と評価手法を素早く再現・拡張できる設計になっています。

Chain-of-Thoughtデータセット実験
記事を読む
ETL Sales — 売上(Penjualan)カテゴリのETLパイプライン

ETL Sales — 売上(Penjualan)カテゴリのETLパイプライン

2025/11/20

OracleデータベースからPostgreSQLへ日次で取引データ(スペアパーツ売上)を移送するAirflow DAGを説明するリポジトリ。DAGは毎日02:00に実行され、365日以上の履歴保持を意図して設計されています。現在はREADMEのみが含まれる最小構成のリポジトリです(実装例や接続情報は含まれていません)。

ETLAirflowデータエンジニアリング
記事を読む
ETL セールス目標パイプライン

ETL セールス目標パイプライン

2025/11/20

Oracle データベースから PostgreSQL へセールス目標(sales target)データを移送するための ETL パイプライン実装。Apache Airflow を orchestrator として用い、インクリメンタルロード、エラーハンドリング、データ検証を備えた実用的なワークフロー設計を示します。アーキテクチャはソースの APPS._CUSTOMERS_TRX_TARGETS テーブルから mb.sales_target への変換/ロードを想定しており、データ品質と再実行性を重視した構成になっています。(約300字)

ETLAirflowPostgreSQL
記事を読む
製品在庫分析パイプライン

製品在庫分析パイプライン

2025/11/25

本リポジトリは「Product Inventory Analytics Pipeline」として、CSVで与えられた販売・在庫データをPython(pandas)でETL処理し、Snowflakeへ格納、Tableauで可視化するまでのエンドツーエンドのデータパイプラインを示します。Apache Airflowによるジョブのオーケストレーションやデータウェアハウス設計(SQL/モデリング)を組み合わせ、サンプルデータとスクリプトで実装例を提供する学習向けリポジトリです。(約300字)

タグ1タグ2タグ3
記事を読む
ブラジルのデジタル格差(digital-inequality-brazil)

ブラジルのデジタル格差(digital-inequality-brazil)

2025/11/26

本リポジトリは、ブラジル国内におけるデジタル・コネクティビティの不均衡をデータ駆動で分析するプロジェクトです。市町村レベルや地域別の接続指標、インフラ分布、競争状況を用いて格差の空間的・経済的要因を明らかにし、指標算出、回帰分析、クラスタリング、可視化を通じて政策的示唆を導出します。ノートブック中心の構成で再現可能な解析ワークフローを提供します。(約300字)

データ分析地理空間不平等
記事を読む
Pulse — リアルタイムデジタルエクスペリエンスプラットフォーム

Pulse — リアルタイムデジタルエクスペリエンスプラットフォーム

2025/11/28

Pulseは、ユーザーの行動、技術的指標、ビジネス指標を統合してリアルタイムに可視化するデジタルエクスペリエンスプラットフォームです。フロントエンドはReact/TypeScript、サーバーサイドにはJava 17を組み合わせ、イベントやテレメトリを収集・処理してダッシュボードで即時に分析できる設計を狙っています。ユーザー体験改善や運用監視、ビジネス意思決定に直結するインサイトを高速に提供する点が特徴です(約300字)。

データ可視化リアルタイム分析TypeScript
記事を読む
大埔宏福苑火災ドキュメンタリー(Hong-Kong-Fire-Documentary)

大埔宏福苑火災ドキュメンタリー(Hong-Kong-Fire-Documentary)

2025/11/28

2025年11月26日に発生した香港・大埔宏福苑の大規模火災に関する公開資料を収集・保存するリポジトリ。ニュース、映像、技術分析、ボランティア情報、公式対応までを体系化し、調査・報道・研究に供する検証可能なアーカイブを目指す。被害状況や材料・施工問題、規制課題を追跡・分析するための一次資料を集中管理する点が特徴。

消防建築安全ドキュメンタリー
記事を読む
粘度(ビスコメトリー)解析ツールキット

粘度(ビスコメトリー)解析ツールキット

2025/12/2

本リポジトリは、せん断率依存の粘度(ビスコメトリー)データを扱うための小規模な解析ツールキットです。合成データを用いたJupyterノートブックとPythonスクリプトにより、フローカーブの可視化、基本的な粘度指標の算出、さらにはタンパク質間相互作用研究で使われる“クラスタ長さスケール”に着想を得た簡易的なクラスタ指標の実験的導入までを行えます。教育・プロトタイピング目的で設計され、データ生成から解析、可視化まで一通り揃っています。

データ解析粘度解析Python
記事を読む
モンテカルロ入門(vignette-montecarlo)

モンテカルロ入門(vignette-montecarlo)

2025/12/3

モンテカルロ法の入門用リポジトリ。基本的な概念、サンプリング手法、誤差評価、可視化を例とコードで示すことで、理論と実装の橋渡しを行う教材的なコンテンツを提供します。小規模ながら実践的なサンプルと図表が含まれており、初学者が Monte Carlo の挙動(収束・分散・標本化誤差)を直観的に理解するのに適しています。教育・解析の導入資料として使いやすい構成です。

Monte Carlo教育可視化
記事を読む
SQL Server DBA ユーティリティ集

SQL Server DBA ユーティリティ集

2025/12/7

日常の SQL Server 管理やパフォーマンスチューニング、障害対応で役立つ T-SQL スクリプト群を集めたリポジトリ。監視クエリやインデックス解析、ブロッキング検出、バックアップ検証、整合性チェック、TempDB 診断、ログファイル監視など、運用で頻出する作業をスクリプト化して提供します。実運用で作りためた実用的なツール群を基にしており、SSMS での実行や SQL Agent による定期実行、他ツールとの連携に適した形で活用できます。(約300字)

SQL ServerDBAT-SQL
記事を読む
肥満(Obesity)分析ダッシュボード

肥満(Obesity)分析ダッシュボード

2025/12/7

Power BIで作成されたインタラクティブな肥満分析ダッシュボードのリポジトリです。政府のオープンデータをもとに、人口統計、生活習慣、食習慣と肥満の関連を可視化します。マルチページのダッシュボード、DAXによる指標、カード・棒グラフ・円グラフ、動的スライサーを備え、肥満パターンと健康トレンドの洞察を提供します(分析用のPBIXファイルと生データ/合成データCSV、報告書が含まれます)。

PowerBIData-VisualizationHealth-Analytics
記事を読む
Power-Bi-(Power BI クラシックモデル分析ダッシュボード)

Power-Bi-(Power BI クラシックモデル分析ダッシュボード)

2025/12/8

このリポジトリは、顧客、従業員、オフィス、受注、支払い、製品ライン、製品に関するデータを統合して可視化する Power BI ダッシュボードのプロジェクトです。Power BI Desktop(.pbix)ファイルやサンプルCSV、レポートのスクリーンショットが含まれており、販売分析、受注処理、顧客・従業員の属性分析などビジネス運用を一元的に把握するための設計がされています。データモデルやビジュアル設計の実例を学びたい人に適したリポジトリです。(約300字)

Power BIDashboardData
記事を読む
Statistical Rethinking(2026年版)

Statistical Rethinking(2026年版)

2025/12/9

Richard McElreath による「Statistical Rethinking」コースの2026年版リポジトリ。MPI‑EVAでの対面講義(録画を公開)として実施されるコースの案内とスケジュール、初級/上級に分かれた授業情報を含む最小限のリポジトリ。教材本体やノートブックは今後追加される想定で、現状は講義運営に関するメタ情報とライセンスが中心。

Bayesian統計学教育
記事を読む
paimon-cpp: Paimon の C++ クライアント

paimon-cpp: Paimon の C++ クライアント

2025/12/12

Paimon の C++ 実装を目指す軽量ライブラリ。リポジトリは小規模でヘッダ/ソース構成を持ち、Apache License 2.0 の下で公開されています。Paimon(データレイク向けテーブルストア)へ C++ からアクセスするための基礎機能やデータ操作インターフェースを提供することを想定しており、低レイテンシや組み込み用途での利用、C++ 環境からの読み書き統合を目指すプロジェクトです。現状は初期段階で、拡張やドキュメント整備に余地があります。

[C++DataLakeクライアント]
記事を読む
SilpaのData & Analyticsプラットフォーム(silpa-das-analytics)

SilpaのData & Analyticsプラットフォーム(silpa-das-analytics)

2025/12/13

AWS上でスケーラブルなデータ基盤と分析パイプラインを構築することにフォーカスした個人リポジトリです。主にAWS Glue、Athena、Lambda、S3を中心に、PySpark/PythonでのETLや増分取り込み、スキーマ正規化、Parquet出力、データ品質管理、自動化ワークフローなど、実運用を意識した設計・実装ノウハウをまとめています。エンジニアリング志向のデータプラットフォーム設計やパイプライン最適化の参考資料として有用です。(約300字)

AWSDataEngineeringPySpark
記事を読む
sqlit — 軽量な SQL Server ターミナル UI

sqlit — 軽量な SQL Server ターミナル UI

2025/12/13

SQL Server に対して手軽にクエリを実行できる、Python製の軽量ターミナルUIツール「sqlit」のリポジトリ紹介。SSMS のような重たい GUI を使わず、Linux や軽量環境から直接クエリを書いて結果を確認したい用途に向く。Python 3.10+ を前提に、MIT ライセンスで公開されており、デモ GIF や最小限のコード群で構成されている。依存や接続は一般的な ODBC/ドライバ経由を想定し、低メモリでの即時利用を目指す設計が特徴。

CLISQLServerPython
記事を読む
Airbnb の探索的データ解析

Airbnb の探索的データ解析

2025/12/15

Airbnb の住宅データを対象に行う探索的データ解析(Exploratory Data Analysis)プロジェクトです。Python エコシステム(Pandas/NumPy/可視化ライブラリ)を用いて生データのクレンジング、加工、集計、可視化を行い、価格傾向や地理分布、外れ値や相関といったインサイトを抽出することを目的としています。README を中心に解析手順とサンプル図表を提供する小規模リポジトリです。

データPythonEDA
記事を読む
図書館データベース管理システム(Data-Base-LIbrary-System-Project)

図書館データベース管理システム(Data-Base-LIbrary-System-Project)

2025/12/15

本リポジトリはOracle SQLで実装された「図書館データベース管理システム(Library Database Management System)」の教材的プロジェクトです。利用者・職員・蔵書・著者・出版社・貸出取引・チケット・職員組織など現実の図書館業務をモデル化し、主キー/外部キー/制約を用いた参照整合性を重視した設計と、サンプルデータを含むSQLスクリプト、Oracle Forms(.fmb)による画面定義、画面キャプチャPDFが含まれます。学習・設計の参考に適したリポジトリです。(約300字)

OracleSQLDatabase
記事を読む