林健
大学主催のコンテストに参加
大学主催の企業のデータを用いて自由に分析するというコンテストに参加した。最終的にその企業に対しプレゼンを行った。今回はそのプレゼンを少し内容を変更して載せてある。※そのため一部見づらいところがあります。 このコンテストに参加してまず大きなデータを扱うこの大変さを思い知りました。分析するのにも時間がかかる上に、わずかなノイズが調べたいことに大きな影響を与えてしまう。このような大きなデータを扱うためにはこのようなノイズをそもそもデータを得る時点で減らす方法や、データ分析をする前に除去する方法を考えるべきだと思いました。この発表を行い企業の方には、「大した知見を得られなかったと本人は言っているが、このノイズの除去というのはとても重要であり、分析の半分以上を費やすといっても過言ではない。そのようなことを学べてよかったのではないか」というようなコメントを頂き、その通りだと感じた。今後はノイズを除去した先のところまでできればよいなと考えている。