ソフトウェアエンジニア | フルスタック開発者 | 機械学習メイン
未踏プロジェクト経験のあるエンジニアです。高度な技術力を駆使して、様々なプロジェクトに取り組んできました。
大学卒業後、大学院に入学し機械学習のモデル開発・ヘルスケアデータへの応用を研究。在学中にNeurlPS、ICMLのWorkshopに論文を投稿し採択されました。その後、大学院時代も含めてを経て約5年間において5つのプロジェクトに従事し主にシステム開発・運用を実施してきました。
機械学習やAIを活用したシステム開発において、データの前処理、モデルの選定、精度向上、運用までの一連の流れを経験してきました。特に、大規模トランスフォーマーモデルを活用した自然言語処理(NLP)や画像認識技術に取り組み、精度向上や計算コストの最適化を行いました。例えば、医療データの解析プロジェクトでは、自己教師あり学習(Self-Supervised Learning)を活用し、文章要約精度を従来比30%向上させることに成功しました。
2025年02月15日現在 氏名:中野 哲平 ■ 職務概要 大学卒業後、大学院に入学し機械学習のモデル開発・ヘルスケアデータへの応用を研究。在学中にNeurlPS、ICMLのWorkshopに論文を投稿し採択されました。その後、大学院時代も含めてを経て約5年間において5つのプロジェクトに従事し主にシステム開発・運用を実施してきました。 ■ 得意分野 - 機械学習モデルのデータパイプラインの作成から実装 - 機械学習システムの要件定義・設計・開発・導入支援 - プロジェクトマネジメント業務(最大10名のプロジェクトマネジャー経験あり) ■ 職務経歴 期間 担当業務(プロジェクト内容) 2024年6月 ~ 2025年1月 (8ヶ月) 【プロジェクト】 香港における機械学習を活用したブロックチェーン分析事業 機械学習によるブロックチェーンデータ分析プラットフォームを開発し、暗号資産の取引監視を行うビジネスを展開。 【プロジェクト規模(人月)/自社メンバー数/ベンダー数】 85人月 / 9名 / 3社 【プロジェクト背景】 ・香港は暗号資産に関する規制が比較的緩やかであり、多くのブロックチェーン関連企業が進出。 ・透明性と市場監視の需要が高まり、AML(アンチマネーロンダリング)対応を強化する必要性が増加。 ・DeFiやNFT市場の拡大に伴い、スマートコントラクトのリスク分析と資産の追跡が重要に。 【担当業務】 ・機械学習を活用したブロックチェーンの異常検知システムの設計・開発。 ・トランザクションデータをリアルタイムで分析し、不審な動きを特定するアルゴリズムを構築。 ・ネットワーク分析を活用し、ウォレットアドレス間の関係性を可視化するツールを開発。 ・取引履歴データを活用し、リスクスコアリングを行うシステムの構築。 ・スマートコントラクトのコードを解析し、セキュリティリスクを自動検出するAIモデルを実装。 ・現地のブロックチェーン企業と提携し、業界全体の透明性を向上させるためのデータ共有プロジェクトを推進。 【実績】 ・不審な取引の検出精度を従来比35%向上し、AML対応の強化に貢献。 ・ウォレットアドレスの関係分析により、大規模な不正ネットワークを検出し、法執行機関と連携。 ・市場における不正取引の特定を自動化し、スマートコントラクトのセキュリティ評価プロセスを簡素化。 ・香港の暗号資産業界と協力し、規制環境の変化に対応したデータ駆動型のリスク管理戦略を提案。 勤務先名:カハール株式会社 (勤務期間:2021年04月~2024年05月) ◆事業内容:機械学習モデルの開発と納品 ◆資本金:10百万円 ◆売上高:200百万円 (2023年12月) ◆従業員数:10名 期間 担当業務(プロジェクト内容) 2023年1月 ~ 2024年5月 (14ヶ月) 【プロジェクト】プライバシー保護を重視したローカルLLMの開発 保険会社やヘルスケア会社に対して 機密性の高い環境で利用可能なローカルLLMを設計・開発 【プロジェクト規模(人月)/自社メンバー数/ベンダー数】 60人月 / 6名 / 2社 【担当業務】 ・主要なローカルLLM(Llama(Meta)、Gemma(Google)、Qwen(Alibaba))を評価し、最適なモデル(Llama-3-8B-Instruct)を選定。 ・PyTorchを用いたカスタムモデルパイプラインを構築し、Hugging Faceのツールを活用してLoRA(Low-Rank Adaptation)による事前学習・ファインチューニングを実施。 ・医療用語に特化したデータセットを収集・整備し、医療環境に適したモデルの微調整を行う。 ・Llama.cppを活用した量子化技術により、リソース制約のあるデバイス向けに推論を最適化。 ・トークナイザの不整合やライブラリアップデートの問題を解決し、安定した環境を提供。 ・医療データの要約や質問応答機能を開発し、ベンチマークテストで高い精度を達成。 【実績】 ・医療文書の自動要約機能を実装し、専門医のレビュー時間を短縮。 ・プライバシーを維持したまま、医療データの分析が可能なシステムを開発し、病院導入を成功。 ・オンプレミス環境でのLLM運用を可能にし、外部データ送信が不要なシステムを構築。 ・実際の医療現場でのテスト運用を実施し、ユーザーからのフィードバックを基に改善を繰り返し、高い実用性を実現。 2022年1月 ~ 2023年12月 (12ヶ月) 【プロジェクト】AIを活用したパーソナライズドマーケティングプラットフォーム開発 企業のマーケティング戦略を高度化するため、AIによる消費者行動分析およびパーソナライズド広告配信システムを開発。 【プロジェクト規模(人月)/自社メンバー数/ベンダー数】 70人月 / 7名 / 3社 【担当業務】 ・消費者データをリアルタイムで分析し、ターゲットごとに最適な広告を提供するAIエンジンの開発。 ・機械学習を活用したカスタマーセグメンテーションモデルの設計・実装。 ・自然言語処理(NLP)を活用したソーシャルメディア分析ツールを開発し、トレンドや顧客の嗜好を自動抽出。 ・A/Bテストを自動化するアルゴリズムを構築し、マーケティング施策の効果測定を迅速化。 ・エッジAI技術を活用し、広告配信の高速化とコスト最適化を実現。 ・企業向けのダッシュボードを開発し、広告パフォーマンスの可視化とリアルタイムレポート機能を提供。 ・データプライバシーに配慮した設計を行い、GDPRやCCPAへの準拠を確保 【実績】 ・広告クリック率(CTR)を従来比25%向上。 ・パーソナライズされた広告配信により、コンバージョン率(CVR)を30%以上改善。 ・企業向けダッシュボードの導入により、マーケティング担当者のデータ分析時間を40%削減。 ・ソーシャルメディアのトレンド分析精度を向上させ、消費者インサイトの取得を迅速化。このプロジェクトにより、企業のマーケティング施策を高度化し、データドリブンな広告戦略の実現を支援した。 2021年1月 ~ 2021年12月 (12ヶ月) 【プロジェクト】大規模トランスフォーマーモデルを活用した法律文書検索システム開発 法務・コンプライアンス業務の効率化を目的とし、AIによる法律文書の検索・要約・分析システムを開発。 【プロジェクト規模(人月)/自社メンバー数/ベンダー数】 75人月 / 7名 / 2社 【担当業務】 ・大規模トランスフォーマーモデル(BERT, GPT-3)を活用した法律文書検索アルゴリズムの設計・実装。 ・法令、判例、契約書、規約などのデータセットを整備し、法的用語に特化したカスタムLLM(法律特化型BERT)を構築。 ・自然言語処理(NLP)技術を駆使し、質問応答型の検索システムを開発。 ・類似判例検索のための埋め込みモデルを開発し、法的リサーチの精度向上を実現。 ・法律専門家向けのダッシュボードを開発し、検索結果のランキング・要約機能 ・データのプライバシーとセキュリティに配慮し、オンプレミス環境での運用を可能に。 【実績】 ・法律文書検索の精度を従来比20%向上し、関連性の高い検索結果を提供。 ・AIによる要約機能の導入により、法律文書の読解時間を50%以上短縮。 ・従来のキーワード検索と比較し、トランスフォーマーモデルの導入により検索効率を30%改善。 ・類似判例検索の導入により、法的リサーチの時間を大幅に削減し、企業のコンプライアンス業務の効率化を実現。 ・企業の契約レビューにおいて、AIによるリスク分析機能を提供し、潜在的な法的リスクの特定を自動化。 ■ 学歴 慶應義塾大学医学部 卒業(2017年03月) 東京大学大学院医学系研究科・医学部 (2021年03月 中途自主退学) ■ 論文 T. Nakano, K. Ikeda, “Predicting Cancer Heterogeneity from One-shot Biopsy,” ICML Workshop on Computational Biology, 2017. T. Nakano, K. Ikeda, “Visualizing Cancer Heterogeneity with Dynamic Flow,” ICML Workshop on Computational Biology, 2017. R. Sato, T. Nakano, et al., “RNA Sequencing Analysis Reveals Interactions between Breast Cancer or Melanoma Cells and the Tissue Microenvironment during Brain Metastasis,” BioMed Research International, 2016. T. Nakano, “Generating Clinical Texts from Conversation,” NIPS Workshop on Machine Learning for Health, 2016. M. Hashimoto, T. Nakano, H. Yashiro, T. Fujita, and M. Jinzaki, "Application of Word2vec to Radiology Report Analysis," Proceedings of the Japan Association for Medical Informatics Annual Conference, vol. 35, pp. 904-905, November 2015. T. Nakano, “Early Detection of Hepatorenal Syndrome from Medical Records,” NIPS Clinical Workshop, 2015. T. Nakano, “Unsupervised Feature Detection for Medical Images,” 28th Annual Conference of the Japanese Society for Artificial Intelligence, 2014. ■ 調整力 AI開発では、エンジニア、データサイエンティスト、ドメインエキスパートなど、多様な関係者が関わるため、プロジェクトの進行には円滑な調整が求められます。モデルの開発段階で発生するデータの品質問題や、AIの出力結果の解釈について関係者と協議を重ね、共通認識を形成することで、より実用的なシステムを実現しました。特に、法律文書検索AIの開発では、弁護士との連携を重視し、検索結果の妥当性を保証する仕組みを構築しました。 ■ 忍耐力 機械学習モデルの開発では、精度向上のための試行錯誤が欠かせません。ハイパーパラメータの調整、データの前処理、モデルのアンサンブル、計算資源の最適化など、複数の手法を組み合わせながら、より良い結果を得るために根気強く改善を繰り返してきました。例えば、トランスフォーマーベースのモデルの開発において、データのノイズ除去やファインチューニングを行うことで、文書検索の精度を20%向上させることに成功しました。 ■ 自己PR 新しい技術を積極的に学び、それを実践に応用することを心がけてきました。特に、機械学習の分野では日々進化する技術に対応するため、自ら調査し、最適な手法を素早く導入するスキルを磨いてきました。業務の中では、論文の調査や実装を行いながら、チーム内で情報を共有し、迅速な意思決定をサポートする役割を担ってきました。 また、プロジェクトを進めるうえで、関係者との円滑なコミュニケーションが重要であることを実感しました。チームメンバーやクライアントに対して、自分の提案の根拠を明確に示し、論理的に説明することで、スムーズな合意形成を行う力を身につけました。技術的な内容を専門外のメンバーにも分かりやすく伝える工夫をしながら、プロジェクトの成果を最大化することを常に意識しています。 困難な状況に直面した際には、単に手を動かすのではなく、問題の本質を見極め、適切な仮説を立てて解決策を導き出すことを意識しています。例えば、機械学習モデルの精度が想定より低い場合には、データの前処理を見直したり、異なるアプローチを検討することで、効率的に課題を解決してきました。これまでの経験を活かし、今後も柔軟かつ迅速に課題に取り組んでいきます。