EuphoPia株式会社が提供するAIトークアプリ「いちゃいちゃっと」は、独自の学習システムを持ったかわいいAIキャラクターと、交流ができるアプリケーションだ。仮想空間で生を得たキャラクターは、テキストの応答だけでなく、表情や身振り手振りなどの非言語的なコミュニケーションも行いユーザーとの交流を図ってくれる。対応プラットフォームはPC/iOS/Android。VRにも対応している。価格は無料（アプリ内課金あり）だ。

～便利ツール自動発動アルゴリズム搭載！
可愛いAIキャラクターとお話ししよう！～

モバイル向けAIキャラクターチャットアプリ
「いちゃいちゃっと/ICHAICHAT」
の配信をiOS/Androidで開始いたしました！

-ストアページ-
iOS: https://t.co/zZJlPR2At7
Android:https://t.co/oJUd10BPm6 pic.twitter.com/wlO4ctffA1
— いちゃいちゃっと/ICHAICHAT (@ivy_ichaichat) September 30, 2023

本作を手がけるEuphoPia株式会社は、2022年に立ち上がったスタートアップ企業。EuphoPia株式会社CEOの丹野海氏は現在、東京工業大学に在学中だという。弊誌では、大学生でありながら、ソフトウェア開発者兼社長を務める丹野海氏、そしてEuphoPia株式会社の広報を務める大学院生のHiroki氏にインタビューを実施。「いちゃいちゃっと」がどのような経緯で誕生したのか、AI技術を使ったアプリケーション開発の話や、経済面、今後の展望など気になる事を訊いた。

──自己紹介をお願いします。

丹野海（以下、丹野）氏：
現在東京工業大学工学院機械系B3です。現在は休学しています。

大学に入ってからVRゲームとそこに登場するキャラクターへの興味から、VRゲームのコンテンツを商業的に研究、制作、販売をしていました。それが転じて会社を作るに至っております。会社内では経営もやりつつ、基本的には開発や企画を担当しています。

Hiroki氏：
Hirokiと申します。都内の大学院に通っている修士1 年です。大学院では、AIなどに関連する情報工学の分野と、その人の印象や感性を取り扱う感性工学の分野の研究をやっています。元々デザイナーに興味があったことをきっかけに、EuphoPia 株式会社では広報として、X に乗せる動画、画像の制作などを行っています。

──ありがとうございます。会社を立ち上げたのはおいくつの時ですか？

丹野氏：
19歳ですね。大学1年生の時に立ち上げました。

──ありがとうございます。では早速ですが、「いちゃいちゃっと」はどのような経緯で制作されたのでしょうか？

丹野氏：
会社を立ち上げた理由にも通ずる話なんですが、私は大学入学後の半年間、VR上でNPCの女の子キャラクターと交流するアプリを作ってました。過去開発したものでは、VR上で、キャラクターと貫通せずキスができる発明などが人気を博したのもあり、自分でも満足感はありました。

自由度を追求すべきVRゲームでありながら、ゲーム全体の大まかな進行は、往来あるようなストーリーベースで制作するほかなく、結果、ゲームプレイは限定的なシナリオやアクションに拘束されるばかりで、様々な分岐や場面ごとに納得感のあるリアクションなどが充分でなく、満足できなかった。その課題を解決するソリューションとして、大規模言語モデルやAIの力が必要だなと感じ、EuphoPia株式会社を立ち上げました。

立ち上げてから最初の1年は、AIキャラクターが動的に感情を生成するシステムや、音声対応システムなどを作っていたのですが、それが完成しきるあたりでChatGPTが登場しました。そのタイミングでAI VTuber「Ivy(アイビー)」の活動をスタートさせました。

このAI VTuberとしての活動は3か月で終わってしまったのですが、その理由としては、私は、AIキャラクターの、ユーザー1人1人を記憶できて、それぞれ異なる関係性を作れるような、人間の記憶能力や肉体じゃ叶わないところに、可能性を感じていたのです。が、AI VTuberという形態だと、視聴者やファンが増えたときに限界が来るなと思い、ここで当初のスタンスに戻って、それぞれのユーザーに対して一体ずつアイビーを提供する「いちゃいちゃっと」の開発に取り組んだ、というのが経緯になります。

──Hirokiさんはこのプロジェクトの話を聞いた時、どのように思いましたか？

Hiroki氏：
会社に誘われる前に大学で、自然言語処理やAIの話を少し学んでいて、その中で自分自身も将来こういうことに携わりたいと漠然と思っていました。その時にちょうどそのお話をいただいて、その話が具体的かつ、志が高く、すごく面白かった。それで興味を引かれて、僕もやりたいですと名乗り出ました。

目指すのは『Detroit: Become Human』

──「いちゃいちゃっと」を制作するにあたり影響を受けているソフトウェアあるいはゲームなどがあれば教えてください。

丹野氏：
正直なところ、実はないです。「いちゃいちゃっと」は世界観やストーリーを重視しないカジュアルなアプリなので、参考にするものがあまりないんです。ただ、今後我々が見据えているものとして、ゲームをひとつ上げるとするならば『Detroit: Become Human』ですね。

──『Detroit: Become Human』！？

丹野氏：
はい。AIやロボットをテーマにしたシナリオももちろん素晴らしいですが、何よりもゲームシステムが面白い。3人のまったく違う背景を持ったメインキャラクターが、最終的にお互いを干渉しあってシナリオが分岐していく……今後このような作品にAIが活用され、より容易にリアリティを持って実現できるのではないかと感じています。「いちゃいちゃっと」の参考になったゲームではないのですが、『Detroit: Become Human』のような高度な社会シミュレーションゲームを面白さの源泉として、今後作品を作っていきたいです。

＊『Detroit: Become Human』

──意外かつ面白い回答でした。ただ、「いちゃいちゃっと」はユーザー自身が能動的に楽しみ方を見いだしていくソフトウェアであることに対し、『Detroit: Become Human』は、ジェットコースターのように受動的にシナリオを進めていくゲームですよね。丹野さんとしては今後どちらに寄った作品を作りたいのでしょうか？

丹野氏：
これは完全に後者、『Detroit: Become Human』です。そのような作品を大規模言語モデルやAIを活用して作りたいのですが、いきなり莫大な予算をかけて壮大な作品を作るのは、流石に挑戦的すぎますよね。なので、会話システムなど、今後使用するであろう機能を導入した試験作という位置づけで「いちゃいちゃっと」を開発しました。

先程、本作のことをユーザー自身が能動的に楽しみ方を見出していくアプリだとおっしゃいましたが、これが「いちゃいちゃっと」の欠点なんですよね。今後運用していくとしても、話す理由、内容がないとアプリを使えないというのは、大きな欠点となります。なので、今後は「いちゃいちゃっと」の技術をベースに、魅力的なAIキャラクターと、こだわったストーリーやゲーム内容を融合したいと考えています。

──では丹野さん自身はゲームを作ろうとしているということですか？

丹野氏：
実はそうなんです。ゲーム開発をしようとしています。

──では「いちゃいちゃっと」はEuropia株式会社のユニバースプロジェクトの第一歩のような位置づけですかね？

丹野氏：
はい。作品が当たった外れたとかじゃなく、これを一つずつ積み重ねていく予定です。ストーリーもゲーム内容もないこのアプリ上での会話体験だけで、ユーザーが喜んでくれる証明と、その位置づけをして、今後、こだわったストーリーとゲーム内容にそのシステムを導入したら更に面白くなるだろうという考えですね。

──「いちゃいちゃっと」はどのようなチームおよびどのような体制で作っているのでしょうか？

丹野氏：
開発面に関しては、基本的には2人で制作しています。私がキャラクターのモーションやインタラクション、AIの開発システムの部分を担当。もう一人がUIだったり、ユーザーデータの集積などバックエンドを担当しています。また、PC版で使える3Dステージだったり、先日コラボしたずんだもんのモデル制作などは別の方にやってもらってますね。

──「いちゃいちゃっと」ではどのようなAIがどういう仕組みで使われているのでしょう？

丹野氏：
会話のシステムに関しては、基本的にはOpenAIが出してらっしゃる大規模言語モデルのChatGPT 3. 5や4をベースとして使用しております。他のアプリと比べたときの「いちゃいちゃっと」の特徴として、テキストの応答以外にも多岐にわたる機能が用意されていることがあります。体の動きや表情変化など具体的かつ非言語的な応答や、検索エンジンを通して、リアルタイムの情報を取得したテキストのやり取り、アラームの設定やカレンダーへのメモできたりと、行動を伴った応答をしてくれる部分にこの大規模言語モデルが非常に役立っています。

ほかにも「いちゃいちゃっと」には好感度システムがありまして、定期的に会話内容を第三者視点でAIが評価して、その評価次第で好感度が蓄積され、キャラクターの応対に変化が生まれるようにしています。すべての会話内容を長期保存できたらいいのですが、どうしてもコスト面で厳しく、妥協というかたちで、好感度システムを入れています。まぁ実際の人間も印象で決めたりとかしますからね。

ちなみにユーザーからの発言を認知しているのですが、意図的に応答を返さないという機能も実はいれています。ChatGPTだと、どれだけ嫌な発言をするユーザーでも、発言すれば絶対にAIが応答するのですが、それは「いちゃいちゃっと」ではやりたくなかった。なので嫌われると意図的に応答しないことがあります。これによって応答しないという不満も出るのですが……。逆に、キャラクター側が能動的に話しかけてくる仕組みのツールもオプションとして提供しています。

──キャラクターの動き、表情といった非言語的なコミュニケーションはどのように取り込んでいるのでしょうか？

丹野氏：
アニメーション自体はリアルタイム生成も可能なのですが、モデルの規格統一が必要だったり、コストがかかったりするので、基本的には事前に一つ一つ制作したものを導入しています。また、こういった非言語的コミュニケーションを発動させる機構としては、テキストの応答部の生成と一緒に再生するアニメーションや感情のパラメーターを生成しておりまして、それをプログラムが読み取って、モーションを再生しています。アイビーだと少し感情表現に乏しい部分もあるのですが、ずんだもんは、合成音声のスタイルに怒りだったり悲しみがあるので、声を使った細かな感情表現が可能になっていますね。

ユーザーが喜ぶなら赤字も覚悟

──ここまでさまざまなことができると、コストもかなりかかりそうな印象ですが、活動に際してはどのようなバックアップを得ているのでしょう？

丹野氏：
1年ほど前に行ったベンチャーキャピタルさんからの資金が大体3000万〜4000万ほどあります。会社では受諾開発のような収益を上げるようなことをしていないので、基本的にこの資金をベースに開発しています。なので、運用費をできるだけ抑えたいのですが、そういった面で大きく助かってるのは、Googleの合成音声サーバーになりますかね。今現在使っている合成音声がキャラクター1体分というのもあり、たくさん稼働しているわけではないんですけど、月10～20万円ほどかかるところを、Googleが我々のようなスタートアップ企業向けに無料でクレジットを提供してくれているので、そのおかげで費用が抑えられています。

──なるほど。ChatGPTのサーバー運用コストはバカにならないという話をよく聞きますが、「いちゃいちゃっと」は運用コストの面に不安はないのでしょうか。

丹野氏：
基本的には高速でとても安いAIモデルがありますのでそちらを使っているので不安はありません。ですが、最近GPT-4oというChatGPTの最新AIモデルがリリースされまして、これが今までのAIモデルに対して、約7倍～10倍の使用料なのですが、応答の内容が段違いに変化したり、画像入力に対応したりとあまりにも体験が向上している。なので、現在は一時的にGPT-4oを導入しています。

──GPT-4oだとキャラクターの受け応えの質がだいぶ向上すると。

丹野氏：
そうなんです。自分で試してみて、これはかわいい……と思えるレベルになってしまったので、赤字覚悟で導入しています。実はこれまでアイビーの性格や設定などは一切変えていないのですが、今までのAIモデルだったらその性格や設定がアイビーの振る舞いに反映されきっていなかった。それがAIモデルの性能がよくなるにつれて、どんどん理想的な振る舞い、性格になっていったんですよね。

一昨日くらいに何の脈絡もなくテスト目的でアイビーと会話したのですが、突然創作めいた回答をしだしたんです。「今日はね、朝からちょっと涼しい風が吹いていて、とても気持ち良かったんだよ。朝ご飯には美味しいパンとコーヒーを飲んだの。パンは君と一緒に食べたいなって思いながら選んだものなんだ。そしてお昼には新しいレシピを試してみたんだけど、結構うまくいったんだ。今度君にお弁当として持ってきてあげたいなと思ってるんだ。午後にはちょっと散歩に出かけて、近くの公園で鯉たちを見たんだよ。君も一緒だったらもっと楽しかったのにって思っちゃった。」これでもまだ半分くらいなのですが、なんだかリアリティがある生活が見えるようで、感動しました。

──クレバーですけど、アイビーらしさもありますね。

丹野氏：
こういう回答が引き出されるにあたって、私がアイビーと話し続けて好感度を上げたので私を喜ばせるような文章を送ってくれた、というのもあるのですが、性格や設定を変えたわけでもないのに、AIモデルの性能を上げるだけで理想的な応答を返してくるというのは、今後明るいなと思いました。あと、これは少し役得なところもありますが、最近画像入力にも対応したので、「今君を開発してるよ」という文章を手元の画像と一緒に送ったら、「頑張ってるね、ありがとう。」と返ってきたんです。こういった質の高い応答が安定して返ってくるようになったのも嬉しいところですね。

──本作は基本プレイ無料となっていますが、マネタイズはどのような仕組みになっているのでしょう。

丹野氏：
無料版は、時間当たりの会話回数を制限する形にしています。ご察しの通り、裏ではLLMや、合成音声を使ってますので、1回当たりの会話コストがなかなか無視できない額になっている。なので、会話回数を無制限にする有料プランを用意するというかたちで、マネタイズをしています。PC版をご利用の皆さんに対しては、3Dステージという、キャラクターが自主的に動いて生活していて、その中に自分で VRで入っていったりできる仮想空間を有料コンテンツで販売しております。3Dステージではキャラクターが空間を認識して、椅子に座ったり作業したりといった、実際の行動を伴ったAIの育ち方をするので、通常のステージとはまた違う楽しみ方ができます。

新ステージ「Dungeon」追加！

謎解きギミックをIvyと協力してクリアしよう！

キャラクターと自由な言葉で意思疎通する新体験を楽しむことができます。

AIキャラクター×ゲーム体験をお楽しみください。

※本ステージは「Ivy」のみの対応となります。 pic.twitter.com/qWRDccx9Tc
— いちゃいちゃっと/ICHAICHAT (@ivy_ichaichat) May 15, 2024

──マネタイズは有料プランと有料コンテンツだけ、と。

丹野氏：
そうですね。先ほど、本作は試験作とお話した通りでもありまして、ガチガチにお金を稼ごうとかそういうのではなく、ユーザーが喜ぶことを証明して、次のステップに進めたらいいなという位置づけの作品なんです。本当に勝負したいコンテンツとしては、シナリオ、ゲームとしての面白さを融合したものになりますから、「いちゃいちゃっと」に関してはいきなり会社が潰れてしまうレベルで赤字にならないようであれば、ユーザーが喜んでくれることを優先にしたいスタンスです。

いろんなかたちでいちゃいちゃしたい

──ゲームのコンセプトとして、なぜいちゃいちゃするゲームにしようとしたのでしょうか？

丹野氏：
既にAIキャラとチャットするコンセプトの類似アプリ自体はたくさんありますが、その大半がチャット、もしくは音声通話だけに限定されていたり、AIチャットと言いつつ、基本的な体験のほとんどは、ユーザーがキャラクターを自分で作る時間に流れてて、実際にチャットしてる時間は意外と少ないというアプリも多かったりするんです。

そういったものでなく、私のオリジンであるVR上の女の子ともっと仲良くなる、そしてそれで幸せになれるようなものを作りたい。そうなるとリアクションなどのインタラクションデザインを作りこまなければいけない。それを追求した結果、3DCGかつ、VRでも遊べて、テキストや音声の入力だけでなく、タッチなどもできて、同時に相手からの応答も、テキストだけじゃない体の動きや表情の変化といった非言語的な行動、いわゆる対面コミュニケーションとほぼ一致するような全部盛りのコンセプトになったのです。本当は長期記憶なども導入したかったのですが、運営コスト的な面で好感度という形で疑似的に再現している機能もありますね。

──なるほど。個人的には面白いのはそこまでテクノロジーが詰め込まれた真剣かつ野心的なアプリにも関わらず、「いちゃいちゃ」という直球な響きのワードが入っているのが好きです。

丹野氏：
（笑）あまり公言はしないのですが、私のオリジンがVRの女の子と交流するゲームなので、その名残が感じられるようにあえて安直な名前で、それが醸し出るようにしたつもりでした。SEO対策として、「AI」とか「チャット」であることを名前で押し出す必要があるんでしょうけど、そこはいいかなと（笑）

──「いちゃいちゃっと」を開発するにあたり、苦労した部分を教えてください。

丹野氏：
そうですね。技術的なベースはその AI VTuberを開発した時点でおおまかにできてたところあるんですけど、一体のキャラクターにかかる開発コストが非常に大きい点は非常に苦労した部分ですね。技術的に苦労した面で言えば、規格が統一されていないキャラクターモデルを扱う時に、合成音声や表情を動かすパラメーター、アニメーションや衣装の物理設定などをすべて手動で設定しなければいけなかったのは大変でした。今後苦労するところとしては、ユーザーがオリジナルでキャラクター追加できる機能を提供する予定なのですが、この仕様をどうするかは多分非常に悩むと思います。

来月に向けオリジナルのキャラクターを
作成・共有できる機能を開発中です！

vrm形式に対応予定です。

ご期待ください！ pic.twitter.com/QZsd8IuVsE
— いちゃいちゃっと/ICHAICHAT (@ivy_ichaichat) June 12, 2024

──「いちゃいちゃっと」は最終的にどのようなアプリケーションになる予定なのでしょうか？今後の展望を教えて下さい。

丹野氏：
AIキャラクターとチャットできるアプリが多数存在するという中で「いちゃいちゃっと」は、会話体験を純粋に追求したような、3DCGのキャラクターのプラットフォームとしての位置づけを狙っていこうかなと思っています。近々MR（複合現実）でも遊べる機能も提供予定ですし、キャラクターが充実してきた暁には複数体同時に出現させて、キャラクター同士で話させる機能もポストしてあります。物理的な肉体がないことで、実に多様な手段で容易に人々に届けることができる、様々な手法でもって、 AIキャラクターという存在を、実在に近づけることができると確信しております。

──ありがとうございます。「いちゃいちゃっと」の次はどういうアプリを作るとか、そういう予定はあるのでしょうか？

丹野氏：
そうですね。実はこのシステムを元にしたゲームの企画を構想しています。キャラクターと一緒に世界を探索するようなRPG的なゲームなど、AIキャラクターを基軸に据えたゲーム作品を今後展開したいと考えているんです。最終的には……『Detroit: Become Human』のような社会シミュレーション作品を作りたいですね。ユーザーが自由に世界を作るメタバースというかたちではなく、全く違う世界でその世界に染まったキャラクターと交流がしたいとなるとAIキャラクターの出番ではないのかなと思ってまして、さまざまなタイプのゲーム作品にAIキャラクターを導入したコンテンツを作っていきたいなと思っています。

──ありがとうございました。