【第2話】認識率99%以上!手書き文字をデータ化するAIサービス「Tegaki」を生んだ多様性(2018.02.03)

前編はこちら

飯沼純(42才)とエリック・ホワイトウェイが共同代表を務める株式会社Cogent Labs(以下・コージェントラボ)。2015年半ばから本格的に事業を開始した2人は、昨年2月に第三者割当増資を実施し総額13億円の資金を調達。昨年8月にはAI技術を駆使し、手書きの文字や活字を高精度で読み取る「Tegaki」を発表。

様々な業界で使われてきた手書き帳票の文字を99%以上の精度で読み取り、テータ化する製品は圧倒的な効率化を実現した。

■AIでデータをデジタル化

渋谷区代官山のオフィスで働く40名ほどのスタッフの約8割は外国人。異なるスキルを持ったインターナショナルな人間を集めることは、外資系企業出身の飯沼とエリックの会社設立当初からの目論見だった。

AIブームが席巻した2015年当時、多くの企業はAIの活用を模索していた。だが、AIを使う前に今、取り組むべきビジネスの課題を教えてほしいと、飯沼は企業のミーテエィングに呼ばれるたびに問いかけた。すると、

「実はデータの入力が大変です。これまでの資料は全部紙で、これをデジタル化するには膨大な手間がかかります」と言う話を耳にする。飯沼のインタビューを元に「Tegaki」開発までのエリックとのやり取りを再現すると、こんな感じだったに違いない。

「紙の資料をビックデータ化したいが、各企業の現場では膨大な紙データの入力がおぼつかないんだ。そもそもインプットとアウトプットは属人的というか、人の能力に負うところが大きい」

「誰がデータを入力するか。経験のある人は正確だし早いけど、経験のない人は遅いし間違いも多い」

「例えばさ、AIの技術を知ってみるとイメージでものを理解する能力に長けている。AIは手書きの帳票を読み取ることに、役立つんじゃないか」

飯沼はそこまで語ると腕を組む。わずかな沈黙が流れる。飯沼もエリックも手書きや印刷の文字や数字を光学的に読み取る、光学式文字読み取り装置(以下・OCR)の存在は知っている。

「でも、OCRの精度は70%程度だというぜ。使っている会社はOCRプラス人で、ビジネスを回している」

「技術があっても、大量の人を抱えて人海戦術で補填しているというわけだね」

「大手企業は入力業務とかを外注に出す。でも中小企業はそんなお金を出せない。うちの実家の鋳物工場だって、注文書とか大量のドキュメントを、事務員が時間をかけて入力するしかない」

飯沼の実家は埼玉県川口市で、鋳物工場を営んでいる。

「仮にOCRの精度が90〜95%に上がったら、人件費を大幅にカットできるね」

エリックの議論は鋭く、リスクやマーケットの競合や、開発するプロダクトがどのくらいのパイを持っているのか等、具体的だ。

「AIを使い、飛躍的に精度の上げた手書きの読み取りの装置が実現したら、人件費の大幅カットにつながるから、中小企業でも入力業務を機械に任せることができる。その分、中小企業はものづくりに集中できるぞ」

「約300万社あると言われている日本の中小企業の中で、仮に1%の3万社が月額で最新の読み取りの機械を使ってくれたら、十分にビジネスになる」

「よし、やってみよう!」

■2ヶ月ほどで99%以上の精度を実現

2人はAIのデープラーニングの技術を用いて精度の高い、手書き帳票の文字や数字を読み取り、データ化するプロダクトの開発を決断する。

開発当初は精度が思うように出なかったが、大量のデータを入れ、技術者が独自の方法でチューニングに取り組むと、読み取りの精度がギュッと上がりはじめた。「これは画期的なプロダクトになるぞ」と確信したが、飯沼はまさか99%以上という、驚異的な精度を得られるとまでは予想しなかった。しかも開発からわずか2ヶ月ほどで、その精度を達成してしまうのだ。

「OCRは日本の研究者も、十数年取り組んでいる技術ですが、キミたちのような精度を出すことができなかった。キミたちは何年、OCRを研究しているんですか」

そんな会話は、OCRに精通した企業の人間と話し込む機会を得た時のことだった。

「独自のアルゴリズムを開発したメンバーの一人は、半年前に来日した統計物理を専門にするアメリカ人です」

「えっ、半年…、アメリカ人…」

飯沼の言葉にOCRに精通した人間は目を丸くした。

そのアメリカ人のメンバーは、OCRという技術があることすら知らなかった。課題は文字を正しく読んでテキスト化することだ、そこに集中した。統計物理という専門をバックボーンに独自な発想を生かし、さらに天文物理等を専門にする別の外国人のメンバーたちの知恵が合わさった時、新しいアルゴリズムが出来上がったのだ。

「しかし、おたくは外国人スタッフを大勢登用しているようですが、外国人の力が必要ななら、東京にいるよりシリコンバレーにオフィスを構えたほうが、効率よく優秀な人材を得られるのではないでしょうか……」

飯沼の説明にうなずいた相手はそうつぶやく。実際、多くの人間はアメリカの方が優秀な人材を集めやすいという考えを抱くが、「東京の環境は悪くない」と、飯沼もエリックも思っている。

日本は経済も治安も安定している。サンフランシスコに比べて家賃だって安い。優秀な人はどこでも仕事ができる。高給より自分のやりたいことをしたいと考える専門家は多い。コージェンントラボは大企業と違い、研究から製品まで携える点も魅力だ。

メンバーが知り合いのメンバーを呼び、現在約40人のスタッフのうち8割は外国人で、その国籍は17カ国に及ぶ。

認識率99.22%の研究を元に、手書き帳票に書かれた文字を高性能で認識できる、「Tegaki」のサービス開始は昨年8月だった。APIでの提供でスタンダードタイプは月額20万円(20万円分のデータ化費用含む)から。「Tegaki」は顧客からのフィードバックをもらい、現在も進化を続ける。

渋谷区代官山の開放感のあるオフィスでテーブルを挟み、飯沼純とエリック・ホワイトウェイもインタビューに加わった。

ーーところで、外国人と一緒に働くのですから、英語は堪能なのでしょうね。
そんな私の質問に、

「ま、起業してここ2年間で鍛えられましたね」そう応える飯沼の言葉を、コロンビア大卒のエリックが笑顔で継ぐ。

「純の知っている英語の量は少ないんです。ところがなぜか、自分の言いたいことが外国人に伝わる。ダイレクトリーというか英語がストレートなんです」

「ITが発展して、世界中の人たちとコミュニケートできるようになった。AIが発展すれば人と人との距離は、もっと縮まると思うんですよ」

あたかも僕のイングリッシュのようにと、飯沼純は言いたげだった。

取材・文/根岸康雄