aikoの愛の重さについてテキストマイニングしてみた テキスト解析でわかるaikoの歌詞「あなた」と「あたし」

こんにちわ~。aikoが好きな工学系女子です。

先日(と言ってもかなり前)zepp東京20周年スペシャルライブ~Zepp Tokyo 20th Anniversary aikoの時。おめでとゼッペちゃん!!~に参戦できました!!!!(番号もはやくて自分の強運にひいた)

zepp東京でもみくちゃになり、死にそうになりながら

「aikoさんの歌の歌詞をテキストマイニングしたら面白いんじゃね???」
「一番登場する単語ってなんだろう????」

とふと思い、デビューから今日までにリリースされたaikoさんの曲の歌詞を分析してみることにしました。

今回の分析では、時期を区切らず全ての曲の歌詞をまず分析し、更にリリースされた時期で区切って細かく分析してみました!(自分の好きなことに技術を使ってみたくなる癖が爆発しましたね。エンジニアの人にはこういう人結構いる気がします。)

※ユーザーローカルさんが提供されているツールを使わせていただき、歌詞を集めて作ったテキストデータを分析にかけています。ツールを使うと速く簡単に分析できるのでありがたいですね!

aikoさんの歌の歌詞に一番多く登場する単語は?

出力されたワードクラウドを見てみると、aikoさんの歌の歌詞に一番多く登場する単語は、「あなた」であることがわかりました。

※ワードクラウドとは、文章中で出現頻度が高い単語を複数選び出し、その頻度に応じた大きさで図示する手法です。Twitterとかで自分のツイート可視化してくれる一時期よく見かけたあれですね。

出力されたワードクラウド(「あした」から「愛した日」までの歌の全歌詞を入力)

私の予想では「あたし」が一番出てくると思っていたのですが、見事に外れたわけですね、、、(10歳の時からライブに行ってるのに外したことにショック、、、、、)

やっぱり一人称と二人称が圧倒的に登場するのは聞いてる印象通りだなと。

「さよなら」と「さようなら」では、書いているときの気持ちに違いがあるのかな?とか、ただ聴いてるだけじゃわからなかった発見もありました。

共起ネットワークもチェックしてみるとなんかすごい結果になってしまった、、、

※共起ネットワークは文章中に出現する単語の出現パターンが似たものを線で結んだ図です。出現数が多い語ほど大きく、また共起の程度が強いほど太い線で描画されます。

「あなた」と「あたし」が大きすぎる、、、

すごい。

可視化するとこんな感じっていうのは、曲聞いても、ライブ行ってもわからないけど、それがわかって興奮してます(笑)

予想外だったのは、「知る」ってこんなに出てくると思ってなかった、、、確かに好きな人のこと知りたくなるよね。

※動詞は言い切りの形に直されています

ひとまず、ここまでのあたし的考察はこんなところ。

<考察>

「あたし」と「あなた」がめちゃめちゃいっぱい出てきているこの構造が恋愛している女子(男子とそうでない人も)に刺さる秘密なのでは???

恋愛ソングってほかの人の書いた曲もこの傾向なのか気になるので、ちがうアーティストでもやってみようかな。

恋愛中は相手のことよく考えるからやっぱり「あなた」が一番出てるんですかね。

ほかのインターン生と話していて思ったことですが、「あたし」が出たら「あなた」はほとんどセットで出てくるよねって話していて、「あたし」という要素は「あなた」ありきの出現なんだなって思いました。確かに好きな人のこと考えていて自分のことも考えることありますよね。あなたはあたしのどこを気に入ってくれているんだろう?って。

単語の出現状況をリリース順に並べ替えて分析してみた

次に、5年ごとに区切って比較したり、リリース順に並べ替えたりしてもう少し細かく分析してみました。

単語の偏った出現でグルーピングしてみるとこんな感じに

単語の出現比率はこのように出力されました

前半(1998~2009)と後半(2010~2019)を比較してみた

単語の偏った出現でのグルーピングをみると、、、

・1998~2003 と 2010~2015は似ている??

単語の偏った出現の「ごめんなさい」「さようなら」「悲しい」の出現からそんな感じしますね。

・2004~2009と2016~2019に出てくる「あの日」

1998~2003 と 2010~2015(「ごめんなさい」「さようなら」「悲しい」)を経て「あの日」が出てくるのかな?

・「あなたへ」も「闇」も闇が深いにおいがして怖い

「あなたへ」について1998~2003の歌詞をみてフレーズをいくつか抽出

あなたへの満タンなメーター
(曲名:親指の使い方 1999年)
あなたへの想い
(曲名:彼の落書き 2003年)

「闇」について2010~2015の歌詞をみてフレーズをいくつか抽出

暗闇

こんな感じで出てきてました

「あなたへ」って2016~2019には出てきてなかったんですよね。

ここまでの結果をオタク仲間と話してみたところ

「あたし」が「あなた」に求めるものがデビュー当時と変わったのかも?

という結論に至りました。

単語の出現比率の

・形容詞について見ると

1998~2003、2010~2015 形容詞多め

2004~2009、2016~2019 形容詞少なめ

になっています。1998~2003、2010~2015はあふれる気持ちを書きたくて仕方ない感じなんでしょうか??

・2004~2009、2016~2019:「僕」の出現(「僕」が出てくる回数を表にまとめた)

「君」と「僕」の出てくる歌詞になって、「あたし」と「あなた」よりも客観視(俯瞰)している(しようとしている)感じがします。圧倒的に2004~2009、2016~2019で「僕」が出てきてますね

「君」と「僕」、「あたし」と「あなた」の出てくる歌詞を引用すると、

君があの人を想う強さに比べれば僕の想いなんて到底かなわない
(曲名:キョウモハレ 2008年)
あたしに今すぐ夢中になって、この唇全てあなたにあげるわ
(曲名:桃色 2000年)

このように「君」と「僕」のほうが「あたし」と「あなた」よりも、のめりこんでいる歌詞でなくなっているように感じます。

形容詞と「僕」の2つを合わせて考えると、

「僕」が多くて、形容詞が2004~2009、2016~2019に少なくなるのは、客観視している(しようとしている)からかもしれないですね。自分のことのように詳細には書かない、気持ちが溢れてないみたいなかんじでしょうか?

ここまで色々見てみた結果、

歌詞を4分割にして期間で分けると、2つの期間で1周するサイクルみたいなのがあるように思いました。(前半で1周期、後半で1周期)

何らかのライフイベントでサイクルに突入しているのかもしれないですね。

リリース順に並べ替えて感情分析した結果がこれ!!!!

うん、なんかすごいね、うん。

感情の種類と、感情の大きな変化の見られた年と、その時期の有名なaikoさんの曲と、同時期の日本の出来事を並べてみました。

左から右に時は進んでいます。

好きが極端に少なくなって、悲しみ、恐れ、怒りが増えたときがあったり、

喜び、好き、悲しみがほとんどなく恐れと怒りで構成されているようなときだったり、急に怒りが多くなったり、、、。

赤裸々に歌詞を書いていて、その結果こんなに変化に富んでいるのかなと思いますね。

勝手にaikoさんの中を見てしまっているのかなとか思います。

まとめと考察

aikoさんの愛の重さについてテキストマイニングしてみました。多くの人にaikoさんの歌が刺さる理由をテキストマイニングして可視化した結果から考えると、「あなた」と「あたし」に関わる感情を喜び・好き・悲しみ・恐れ・怒りを使って表現することで、想う人がいる人たちのいろんな状況とか状態に似たような歌詞になっていて共感されているのだと思いました。

工学系っていうとゲーム作ったりとかアプリ作ったりのイメージが強いのかなと思います。もちろんそういう人もいるけど、私みたいに、一見技術と関係のない好きなことに学んだ技術を使っている人間もいます~。

こんなことにも情報の技術使ってる人いるんだって思ってもらえたら嬉しいし、ほかにもこんな感じで関係ないことにも技術的なアプローチでやってくれる人ができたら嬉しいな~。

自然言語処理面白いな~って最近なってきてるので、簡単なコードを自分で書いて解析してみたいです。

そして何よりご本人様にこれを見てもらえたら、、、、、泣きますね完全に。

ディップ株式会社's job postings
Anonymous
27752081 1853403661399906 1761704735410447396 n
C08432c0 ceef 4d3f af4e 9d819b02fbb3?1561629795
212b1c38 8b49 406a bd43 8badc04558d7?1559694611
Picture?height=40&width=40
81efda80 8e9c 443a 8a94 c1641f555ea7?1513449660
8 Likes
Anonymous
27752081 1853403661399906 1761704735410447396 n
C08432c0 ceef 4d3f af4e 9d819b02fbb3?1561629795
212b1c38 8b49 406a bd43 8badc04558d7?1559694611
Picture?height=40&width=40
81efda80 8e9c 443a 8a94 c1641f555ea7?1513449660
8 Likes

Weekly ranking

Show other rankings

Page top icon