A3RT

A3RT

A3RT(アート)は「ANALYTICS & ARTIFICIAL INTELLIGENCE API VIA RECRUIT TECHNOLOGIES」の略称です。
A3RTは機械学習のなかでもDeep Learningなどに代表される、いわば人工知能とよばれる分野のロジックをひとつのブランドで統一・整備をし、社内へ展開するためにプロジェクト化されたソリューションの総称です。

 

2017年から公開しているみたいだけど、つい最近知ったのでメモ。

 

昨今、リクルートグループ内においても機械学習を活用した施策開発のニーズが高まっていました。
しかし社外製品の利用は「汎用性が高いがゆえに、細かな利用ニーズに合致しづらい」、フルスクラッチ開発の場合は「自由度が高い一方で、時間・コストがかかる」といった課題がありました。
この現状を打破し、機械学習ソリューション活用の敷居を下げ、スピーディかつ低コストで施策への導入ができるよう設立されたAPI 群がこのA3RTです。

当初はA3RTについても、リクルートグループ内に限って導入してきましたが、以下のような理由からこのたびグループ外への提供を決意しました。

 

つまり、リクルートグループ内で使っているAIのAPIを無償で外部に公開しますよってことらしい。

え。すごい。

 

10種類公開しているようです。

うおー、気前が良いね。

 

Listing API

リスト生成をするためのAPIです。
ユーザーの行動ログを元にアイテム間の相関リストや、各ユーザーへのレコメンドリストなどを生成することが出来ます。
オンラインレコメンドや、ターゲティングメールなどに使用します。
モデルリングのためのデータを手元に用意していただければ、元データアップロード・リスト生成ロジック実行・リストダウンロードの機能が利用出来ます。
version1で利用できるアルゴリズムは、word2vecのみとなります。

Image Influence API

画像と画像に対応する点数を用意すると、未知の画像が自分好みかどうかを点数で把握できるモデルが作成可能です。
1つの例としてConvolutional Neural Networkを用いて、肉の写真の点数を0〜9点で予測するAPIを用意しました。
肉の写真をアップロードすると、その写真が不特定多数から見て良さそうに見えるかどうか、点数という形で返却します。

Text Classification API

Text Classification APIはConvolutional Neural Networkを利用して、文章の分類を行うAPIです。例えば、学習データとしてニュース記事とそのトピック(スポーツや政治など)を与えると、未知の記事データに対してのトピックを推定してくれます。今回のdefaultモデルでは、求人系の文章とそれがどのような職種の求人かというラベルを学習させています。また、本APIではラベルとテキストを対にしたcsvがあれば、あなただけの文章分類モデルを作成し、試すことができます。リファレンスを参照して、是非ご利用ください。

Text Suggest API

Recurrent Neural NetworkやLSTMと呼ばれる構造の言語モデルを利用した、文章の自動生成および入力補助を実現するAPIです。膨大な原稿を学習することで、その中の文章の言い回しや表現を機械が学習し、ユーザが入力した単語や文章の後に続く文章を生成する機能を提供します。
このAPIを利用することによって、既に学習した原稿のような自然な日本語の文章を自動で生成したり、文章の入力機能に組み込むことによるテキスト入力支援ツールなどを簡単に作成することができます。

Proofreading API

Proofreading APIはLSTMを利用して文章として怪しい箇所を検知するAPIです。
例えば、”経験や視覚を活かせる職場です”という文章に対して”経験や<<視覚>>を活かせる職場です”という形で不自然な箇所を指摘し、その怪しさ度を返します。また、文章として書き換えた方が良さそうな単語も検知をします。
今回提供するモデルでは求人系の文章を学習データとしているため、是非近いドメインの文章をインプットにして試してみてください。

Talk API

Talk APIはChatbotを作成するためのAPIです。
Recurrent Neural Network(LSTM)を用いた入力文からの応答文生成による日常会話応答機能を提供します。
Talk APIを活用したChatbotによって様々なアプリケーション上でユーザとの対話を自動化し、
どのようなタイミングにおいても即座にユーザからの問いかけに対して応答することができます。

Image Generate API

Image Generate APIは、Deep Convolutional Generative Adversarial Networks(DCGAN)の技術を用いてオリジナルの画像を生成するAPIです。
このモデルでは、既に自動生成された画像を合成し、新しい画像を作ることができます。
作成した画像を評価することで画像の生成に反映させることができます。
今回はネイルのデザイン生成のモデルを用意しました。

Image Search API

画像とテキストの相互検索APIです。
マルチモーダルDeep Learningという技術により画像とテキストの関係を学習することでテキストから画像を検索したり、画像からテキストを検索したりといったことが可能となります。
オリジナルの画像から学習をして検索をかける事が可能になりました。(サンプルデータからの検索も引き続き利用可能)

Text Summarization API

Text Summarization APIは、文章要約を行うAPIです。
このモデルでは、入力された文章の意味を読み取り、意味が遠い文章を自動で判断・抽出し、要約結果として出力することができます。

SQL Suggest API

SQL Suggest APIは、日本語の質問文をSQLに変換するプロダクトです。
SQLが書けなくても、質問文を入力すればデータベースになげるクエリを得ることができます。

Named Entity API

Named Entity APIは、固有表現抽出を行うプロダクトです。
Conditional Random Fields(CRF)とRecurrent Neural Network(Bidirectional LSTM)の技術を組合せ応用することで、固有名詞・数値などの品詞を識別することができます。
学習データから固有名詞を除去したい時などにご活用ください。

 

 

個人的に興味があるのはText Summarization APIですね。

文章を要約してくれるAPIですが、どのくらいの精度なんだろうか。

今度試してみよう。ニュースとか要約してガンガン流し読みできるようにできたらステキ。