400万人が利用する会社訪問アプリ
京都大学理学部に所属している神力亮之介と申します。 大学で、AI・機械学習・統計の勉強をしており、データサイエンスに興味があります。 また、長期インターンシップに参加したり、個人で分析Webアプリケーションの制作や統計を用いたデータ分析を行っています。
データサイエンス分野で活躍できるようになりたいです。 領域・業界は、絞らず幅広く見ており、さまざまなことを経験したいと考えています。 そのために、現在は様々な分析方法や技術を磨いていきたいです。
私の研究の目的は、拡散モデルを用いた、粗視化分子動力学シミュレーションの力場構築を行うことです。分子動力学シミュレーションは、タンパク質を原子レベルで解析するのに有用な手法ですが、計算には多区の時間が必要です。この課題に対応するため、私たちの研究では「粗視化」という手法を用いています。これは、複数の原子を一つの粒子として扱い、シミュレーシ
物体認識モデルを組み込んだWebアプリケーションを作成しました。 初めてのオリジナルWebアプリケーション制作は、制作プロセスが全く分からないことが課題でした。なぜならば、情報が大量にあり、完成への筋道が複雑だったからです。 そこで私は、一旦立ち止まって、完成から逆算して効率的な制作プロセスを考えることにしました。まず、完成までのプロセスを分解し、それぞれで実装したいことを明確にしました。そして、実装コードを調査・選択をし、制作プロセスをより具体化しました。ここで工夫したのは、実装したいことに近いコードを沢山集めて分解し、参考にできる部分だけを抽出することです。抽出した部分的なコードを組み合わせ、再構築することで、実装したいコードを作りました。 その結果、構造的に実装することが明らかになり、スムーズに開発や改善・修正を進めることができました。
大乱闘スマッシュブラザーズで活躍している選手の強さを分析しました。 分析したきっかけは、これまでの勝敗データの蓄積から、選手同士の総合的な強さを比べてみたいと思ったからです。そこで私は、ベイズ統計モデリングを用いて、選手の相対的な強さを推定しました。 この分析では、用いる対戦データが大量の欠損や重複のある煩雑なデータであることが課題でした。そこで私は、データを俯瞰してみることによって、データのクレンジングを一つずつ行いました。例えば、各選手ごとに試合数を計測し極端に試合数の少ない選手を確認することによって、データの誤りを修正していきました。最終的に、納得のいく選手の強さ表を作成することができました。
資料作成業務と、データ分析業務を担当しました。 資料作成業務では、チームのマネジメントを担当し、メンバーの受験経験を網羅した学生向け資料を作成しました。 データ分析業務では、企業の指導データを用い、教師と生徒の良い相性を明らかにしました。
企業の指導データを用い、教師と生徒の良い相性を明らかにしました。 この分析業務は、データ量が膨大で分析に時間がかかるという課題がありました。そこで私は、仮説検証の手間を減らすため、機械学習を用いた、より効率的な分析計画を提案しました。分析計画を提案する上で気をつけたことは、納得できる分析プロセスであることです。そのために、まず結果のイメージを具体化しました。そして、結果から逆算して、どのようにその結果を出すのかを考えました。その結果、当初の半分の時間で遂行でき、納得してもらえる分析結果を示すことができました。
チームメンバーの受験経験を取り入れた、受験情報資料を作成しました。 初めは分担して作業をしていましたが、それぞれの作成資料を合わせてみると、統一感のない資料になってしまいました。 そこで私は、資料全体を漏れやダブりがないように構造化し、メンバーに担当を割り振る役割を務めました。資料作成担当を割り振る際に気をつけたことは、メンバーの得意不得意に合わせて割り振ることです。必ずメンバーそれぞれにヒアリングを行い、どんな特徴を持った人なのかを分析しました。その結果、各々が力を発揮しやすい環境を提供でき、評価の高い資料を作成できました。