アルゴリズムエンジニア
自然言語処理で実際のビジネス課題を解決するアルゴリズムエンジニア募集
MNTSQ, Ltd.
現在、私は「未来の社会インフラとなるリーガルテクノロジーをかたちにする」ことをミッションに、MNTSQという会社の立ち上げをしております。とはいえ、私はこれまで、一般的なエンジニアと同様、リーガルサービスとは縁遠い人生を歩んできました。契約書を読み込んだ経験もそこまでないですし、大学で法律の授業をとったこともありません。訴訟に巻き込まれたこともありません。
この投稿では、なぜ、そんな私がリーガルテックの分野に面白さを見出しているのかを書きたいと思います。結論から言えば、リーガルテックの分野は 1)自然言語処理の発展により新しく拓かれていく分野で + 2) 大きなビジネス上のインパクトを生むことができ + 3) 技術的なチャレンジの幅も大きい、とてもユニークな分野だと考えているからです。
近年、アカデミックな世界においては、自然言語処理のブレイクスルーと言われるものがどんどん出てきています。特に昨年のBERTという新しいモデルが生まれてからは、その成長速度も急激に上がったように感じます。今年に入ってからもGPT-2、XLNet、RoBERTa、ALBERTなど数々のモデルが生み出され、実際のタスクにおいても高い精度を達成しつつあります。
質問応答のデータセットの「SQuAD 2.0」というタスクにおいては既に人間を超えるスコアが出ていますし、中国の高校生向けの英語問題を集めたデータセット「RACE」などでもこの1年だけで約60%の正答率だったものが90%近くまで正答率が上がってきています。英語の読解のみではなく、なんと理科の問題などでも85%の正答率が出ていたりします。
今まで人間しかできなかった「文書を読んで、答えを出す」というタスクが、一部の領域ではありますが、機械でもできるようになってきていると言えます。この勢いはこれからも止まることはないと思います。より様々な分野で、より高い精度が達成されていくのではないでしょうか。これによって新しくできるようになることは数多くあると思います。
実は、リーガルサービスの一部は、自然言語処理そのものと言えます。リーガルサービスの世界では、全てのアウトプットが「テキスト」に集約されています。そのような世界で、弁護士は、テキスト(契約書などの法務書類)を入力とし、そこから示唆を抽出する。あるいは、実世界の状況を入力として、テキスト(法務書類)を出力するといったような操作をしているからです。
例えば、MNTSQが取り組んでいる法務DD(デューデリジェンス)と呼ばれるプラクティスがあります。これは、企業買収を行う時に、買収の対象会社の法務上の問題点の有無を調査する手続きです。そもそも法務DDをせずに企業買収を行うことは、善管注意義務違反となってしまうため、法務DDは買収を行うために欠かすことができないものです。
この法務DDの中では、対象会社の契約書群から法務的に危険な条項を検出する作業がメインとなります。これはまさに「文書を読んで、(その条項が危険かどうか)答えを出す」というような作業です。
そういう意味で、自然言語処理とリーガル領域の相性はとても良く、アルゴリズムがビジネスに対して大きなインパクトを出せうる分野なのではないかと考えています。
技術的なチャレンジとしても、ユニークで面白いなと思うところが多いです。
リーガルな文書というのは、世の中一般のテキストコーパスとは全然違う性質を持っています。契約書に出てくる単語というのはとても偏っていますし、文法的に正しく書かれていることが多いです。また、文書全体が「条」「項」「号」という単位で構造化されていたり、条項の間に参照の関係があったりすることも特徴的です。これらの性質を活用しながらより踏み込んだ分析にチャレンジすることも可能です。
また、「弁護士になるためにはめちゃめちゃ勉強しないといけない」というイメージがあるように、リーガル領域はとてつもなく広く深いドメイン知識があることも特徴の一つです。アルゴリズムエンジニアであっても、リーガルチームと協働しながら、リーガルなドメイン知識を理解・活用し、ヒューリスティックに落とし込んでいくことも重要になります。
MNTSQではこのようなチャレンジを通じて、トップクラスの弁護士の、プロフェッショナルな知見を、自然言語処理/機械学習アルゴリズムに染み込ませ、使いやすい形に落とし込んだプロダクトを作っていきたいと思っています。
===
MNTSQでは一緒にインテリジェントなソフトウェアをかたちにしていくメンバーを募集しています。少しでも気になった方はお気軽に連絡ください!