Kazuhiro Esaki

About me

Kazuhiro Esaki

AI・XR研究者 | 博士課程在籍中

名古屋大学大学院情報学研究科の博士課程に在籍し、 AIとXR技術を組み合わせた教育・トレーニングシステムの研究開発に取り組んでいます。 特にコンピュータビジョン、3Dアバター表現、行動解析AIを専門とし、 AIによるフィードバックを活用した没入型の学習体験を生み出すことを目指しています。

様々なプロジェクトに参加し、研究開発やシステムの設計・実装まで幅広く担当してきました。 スタートアップ企業でのプロダクト開発の経験もあり、技術を社会実装するアプローチを探求しています。 論文投稿や発表に加え、国際交流やイベントにも積極的に参加し、学術的な知見と実践的なスキルを兼ね備えた人材を目指しています。

技術スキル・開発経験

プログラミング言語
Python
7年
使用用途
  • 機械学習モデルの開発・実装
  • データ分析・各種ツールの作成
  • バックエンド開発
主な使用ライブラリ
NumPy, TensorFlow, scikit-learn, pandas, Mediapipe, Flask
C#
7年
使用用途
  • Windowsアプリ開発
  • Unityでのゲーム開発
JavaScript
3年
使用用途
  • Webアプリのフロントエンド実装
  • アニメーション
GAS
3年
使用用途
  • Line Messaging APIと連携したサーバーサイド開発
  • 飲食店の予約受付システムの開発
XR・アプリ開発
Unity
7年
使用用途
  • XRアプリケーション開発
  • エディタ拡張などのツール作成
  • 3Dアバターの表現(LipSyncなど)
OpenXR/SteamVR
5年
使用用途
  • Pico4やQuest3向けのスタンドアロン開発
  • トラッカー情報の取得
Photon
3年
使用用途
  • マルチプレイ対応
  • 3Dアバターやオブジェクトの同期
  • チャットや通話機能
AI・コンピュータビジョン
Tensorflow
5年
使用用途
  • 深層学習モデルの構築・学習
  • アーキテクチャや損失関数のカスタマイズ
Pytorch
1年
使用用途
  • 最新の論文の追実験
  • モデルの構築・学習
Numpy, Scipy
5年
使用用途
  • データの前処理
  • 3次元再構成
OpenCV
4年
使用用途
  • 背景除去やノイズ除去などの画像処理
  • カメラキャリブレーション
  • 3次元再構成
Web・インフラ
React/Typescript
1年
使用用途
  • 小テスト用Webアプリの開発
  • Youtubeショーツ自動生成ツールの開発
HTML/CSS
4年
使用用途
  • フロントエンドUI開発
  • 動画アノテーションツール
  • ポートフォリオ
Flask
4年
使用用途
  • バックエンド開発
  • API設計
  • データベース設計(MySQL)
Linux/Docker
5年
使用用途
  • 機械学習環境の構築
  • コンテナの管理
開発ツール
Git/Github
4年
使用用途
  • 研究室内のプロジェクト管理
  • データセットや学習モデルの公開
  • ツールの管理・公開
VSCode
7年
使用用途
  • python開発
  • バックエンド開発
Visual Studio
4年
使用用途
  • Unity開発
  • Windowsアプリ開発
Blender
2年
使用用途
  • 3Dアバター作成
  • モデリング
その他
AWS
1年
使用用途
  • Web版アプリのデプロイ
Raspberry Pi
2年
使用用途
  • 簡易的な会話ボットの作成
  • カメラを使用した人物の識別

研究内容

#1 XRダンストレーニングシステム

「理想のダンスをマスターするための次世代トレーニングシステム。AIとXR技術の融合で、いつでもどこでも専属コーチがあなたの練習をサポート。」
私が主に取り組んでいる研究テーマです。学部時代から開発をはじめ、地元のダンススクールと連携して試行錯誤を重ね、2025年夏に製品化しました。

ボディトラッキング
XRトレーニング環境
AIフィードバック

#2 ダンスの自動評価とフィードバック生成

システムの要素技術として、ダンスモーションの自動評価とユーザーフィードバックの生成に取り組みました。
ダンスは動きに正解がないことから、手本動作を基準とした相対評価のフレームワークを提案し、タスクの設計からデータ収集、学習モデルの構築、学習・評価まで全体を通して研究に貢献しました。

アノテーションツール
ダンス動画アノテーションツール
自動評価フレームワーク
自動評価フレームワーク

#3 ボディトラッキングデータの融合

もう一つの要素技術として、リアルタイムボディトラッキングに取り組みました。
この研究では、ヘッドセット内蔵のセンサーと外部カメラ映像から得られるデータを深層学習ベースで融合するフレームワークを提案しました。 先行研究のモデルをタスクに合わせて拡張し、リアルタイムでの高精度な全身トラッキングを目指しました。

データ収集
データ収集
モデルの全体像
モデルの全体像

プロジェクト


XR講義システム

Unity XR Quest3 Pico4
画像 XR空間でアバターやスライドを用いて講義コンテンツを作成・視聴するシステムです。 主に機能の追加やメンテナンス、バグ修正を担当しており、PC版は実際に大学内の講義で運用しています。

XRロボットアーム訓練システム

Unity Photon
画像 研究機関との共同開発として携わっており、工場現場におけるロボットアームの遠隔操作をXR空間でトレーニングするシステムの設計・開発を担当しています。

論文一覧


受賞歴


その他の制作物・ツール


MemoryJourney

Unity C# Photon
ツール画像 すごろくをベースにしたUnityゲームで、家族や恋人と思い出を振り返りながら追体験することをコンセプトとしています。ゲームロジックに加え、オンライン対応など複数の技術を組み合わせて開発しました。個人制作です。

プログラミングクイズ

React TypeScript Flask GPT-4o-mini
ツール画像 pythonプログラミングの学習用アプリです。エラー内容をフィードバックしたり、GPTを用いたヒントの提供ができます。個人制作で、アルバイト先のプログラミング教室に導入予定です。

Python Mediapipe
ツール画像
まばたきから自分の集中状態や眠気を数値化し、可視化する事ができます。

タイピングゲーム

HTML/CSS JavaScript
ツール画像 小学生向けの実践的なタイピングゲームを作成しました。Pythonの基礎文法に加え、EV3やpybrickなどの応用問題も作成できます。

雑談グラフ

HTML/CSS JavaScript Flask Whisper GPT-4o-mini AWS
LINEスクリーンショット 雑談の内容を録音してリアルタイムで会話の流れを可視化するWebアプリを作成しました。APIを活用して話者識別や文字起こし、要約を行い、リアルタイムでグラフを更新します。主にバックエンドの処理を担当し、差分を利用してグラフ操作を行う部分を工夫しました。

おぼえるくん

LINE Messaging API Google Apps Script Google Spread Sheet
LINEスクリーンショット

LINE Messaging API+GASで共有メモアプリを作成しました。行きたい所、やりたい事をメモし、恋人や家族と共有することができます。SpreadSheetとの連携や基幹部分の実装を担当しました。