AI音声アシスタントアプリ「EMVI」当事者レビューエーアイ音声アシスタントアプリ「エンヴィ」当事者レビュー

アメリカ・アナハイムで2025年3月に開催された、世界最大級のアクセシビリティ関連のイベント「CSUN(シーサン)」のレポートの番外編です。
海外製のAI(エーアイ)音声アシスタントアプリ「EMVI(エンヴィ)」を実際に当事者の白鳥環(しらとり たまき)さんに使ってもらいました。
「EMVI(エンヴィ)」って?
会話型のAI(エーアイ)を使ったアプリで、アプリを起動してスマホの画面中央のカメラボタンを1回押すだけで、3秒以内に自動的に画像を撮影します。
写真を撮影したら、ユーザーは「何が映っているの?」などと知りたい内容を指定すると、撮影したものについて明確でわかりやすい説明を音声で教えてくれます。海外製のアプリでありながら日本語に対応しているのもポイントです。
2024年にローンチし、現在はAndroid、iOSの両方で使えますが、サブスクリプションとなっています。
詳細は以下の記事にあるので、そちらを参照ください
使用してみてどうだった?
白鳥(しらとり)さん:今回はEMVI(エンヴィ)とBe My AI(ビーマイエーアイ)の両方を約1週間使ってみました。どちらも初めて使いましたが、同じくらい使いやすかったです。EMVI(エンヴィ)は操作がシンプルで、スワイプするときの指の向きさえわかれば直感的に使えるのが魅力。
いくつか方法はありますが、今回はどちらもアプリを起動して写真を撮影し、その説明を聞き比べるということを行いました。EMVI(エンヴィ)は説明が細かく、行き届いた感じがしました。Be My AI(ビーマイエーアイ)のほうが端的に説明してくれて、撮影したあとすぐに説明が入るのがいいなと思いました。
メニューはどう?
約1週間後、カフェに集合し屋外実験を行いました。両方のアプリを使って、カフェのメニューのような文字が書かれている写真で試すとどうなるのかを実験してみました。
まずはEMVI(エンヴィ)から。
アプリを起動し、カフェのメニューを写して音声でたずねて回答をもらうということを何度か試してみました。

コーヒーなどのドリンクの写真の描写は細かく説明されるものの、テキスト情報は苦手な様子。
「アイスコーヒーはいくら?」のように具体的に聞いても思うような返事がなかなかもらえませんでした。
ページを変えてみたり、よりテキスト量が少ないメニューに変えたりしてみましたが、やはり結果はさほど変わらず。
ただこのアプリはローンチしてまだ時間が経っていないこともあり、その点は今後に期待したいところ。日本語、難しいですよね。

Be My AI(ビーマイエーアイ)でも同じメニューを写し、その違いを探してもらいました。こちらは説明がシンプルながらある程度メニューの名前や価格を読み上げていました。
テキストのある写真情報を読み取るという観点では、今のところはBe My AI(ビーマイエーアイ)に軍配があがりそうです。ちゃんと読み上げたチーズケーキとコーヒーのセットを注文しました。

非言語的な写真の情景描写の精度は抜群
メニューのような文字がたくさんあるもので読み上げてもらいましたが、テキストのついていない写真の描写はどうなのでしょう。白鳥(しらとり)さんに両方のアプリの違いについてもう少し詳しく聞いてみました。
白鳥(しらとり)さん:家族と桜を見にいったときのこと。桜の木の下にいる奥さんの写真を撮影して、EMVI(エンヴィ)とBe My AI(ビーマイエーアイ)でそれぞれ説明をしてもらいました。
すると、Be My AI(ビーマイエーアイ)は全体をサラッとかいつまんで説明してくれたのに対し、EMVI(エンヴィ)は奥さんの表情も細かく伝えてくれたし、桜も「白みがかっている」など、情緒ある説明をしていたのが印象的でした。
しかも写真の背景の説明も秀逸。周囲に若い人が多く、グループが複数映っていることにも触れ、自分が今いる場所の情景を細かく説明してくれました。こういった風景描写はEMVI(エンヴィ)のほうが断然上だといえます。
大切な写真を見返したいときにも
白鳥(しらとり)さん:見えにくくなっても、今回の奥さんの写真のように、写真として保存しておきたいときや、思い出の写真を見返したいときもあります。
ただ、見えにくいのでそれがどんな写真かがよくわからない。そういうときに繊細な描写で教えてもらえるEMVI(エンヴィ)が便利だと思いました。
わたしの見えなくなってからのスマホのカメラロールには、どちらかというとほかの人に状況説明するために一時的に必要になって写した写真がたくさん残っています。
でも見えていた頃のような、ときどき見返したくなる記念写真も残したい。数年前の記憶の姿でとまってしまった子どもの様子もこれでアップデートできたらいいなって。
シンプルにまとめてほしい場合はBe My AI(ビーマイエーアイ)、抽象的なものを詳しく描写してほしい場合はEMVI(エンヴィ)といったところのようです。
今回EMVI(エンヴィ)は無料お試しがあったのでそちらを使いました。突出した機能があるものの、基本的にはサブスクリプションです。
ローンチされたばかりということもあり今後パワーアップする可能性が高いですが、現状はコストや用途に応じて使い分けるのがよいかもしれません。
※2025年4月11日時点の情報です
EMVI(エンヴィ)ページは以下URLから
本文ここまで