2026年3月1日、AI音声入力ツール「Aqua Voice」がiOSに対応しました。これまでMacとWindowsのデスクトップ専用でしたが、iPhoneでも使えるようになります。
「iPhoneの音声入力で十分じゃないの?」と思う方も多いかもしれません。ただ、実際に長文を音声入力すると、句読点がおかしかったり、「えーっと」がそのまま入ったり、結局手で直す時間がかかります。Aqua Voiceはその「直す手間」をAIで大幅に減らせるツールです。
この記事では、Aqua Voice iOS版の具体的な機能、Apple標準音声入力との精度差、料金、そして使う前に知っておきたい制限をまとめました。
Aqua Voiceは何ができるのか ― 3つの特徴
Aqua Voiceは、Y Combinator(W24)出身のスタートアップが開発するAI音声入力ツールです。一般的な音声入力との最大の違いは、「話したこと」をそのまま文字にするのではなく、独自のAIモデル「Avalon」が「言いたかったこと」を解釈してテキスト化する点にあります。
リアルタイムのテキスト表示
話している最中にテキストが表示される。録音を止めてから変換を待つ必要がなく、入力中に間違いに気づける。
アプリに応じた文体の自動調整
メールアプリでは丁寧な文体、チャットアプリではカジュアルな文体に自動で切り替わる。画面の内容も読み取って精度を高めている。
フィラーワードの自動除去
「えーっと」「あの」「まぁ」といった口癖を自動的にカットし、句読点や改行も適切に挿入してくれる。
CEOのFinn Brown氏は自身が読字障害(ディスレクシア)で、小学6年生からディクテーションソフトを使い続けてきた経験が開発の原点になっています。「既存の音声入力は”聞こえた音”をそのまま文字にするだけ。でも人間が求めているのは”言いたかったこと”のテキスト化だ」という発想で、独自モデルAvalon を設計したとのこと。
Avalonの技術的な特徴は、開発者の実際の作業環境(ターミナルのコマンド履歴、コードエディタの操作ログ)と音声データを組み合わせて学習している点です。そのため、「kubectl」「PyTorch」「useEffect」といった技術用語の認識精度が97%と高く、エンジニアやプログラマからの支持が厚いツールでもあります。
Apple標準音声入力とどれくらい精度が違うのか
「iPhoneの音声入力もそこそこ使えるのに、わざわざ別のアプリを入れる意味あるの?」という疑問は当然です。9to5Macが実施した比較テストの結果を見ると、その差がはっきりします。
📊 スティーブ・ジョブズのスタンフォードスピーチ読み上げテスト(9to5Mac調べ)
❌ Apple標準音声入力
認識エラー
17箇所のエラー段落分け
なし(1つのテキストブロック)✅ Aqua Voice
認識エラー
1箇所のエラー段落分け
自動で段落・句読点を挿入エラー数だけでなく、出力されるテキストの「使いやすさ」にも差があります。Apple標準では改行なしのテキストブロックが出力されるため、あとから手動で段落を入れる必要があります。Aqua Voiceは話の区切りを自動判定して段落を分けてくれるため、そのまま使えるケースが多いです。
認識精度を示す数値として、Aqua VoiceのWER(単語誤り率)は3.2%です。Googleの音声認識が5.5%、OpenAIのWhisper Large v3と比較しても8つのテストのうち7つで上回ったとされています。また、対応言語は49言語で、日本語にも対応しています。
💡 日本語利用について
Aqua Voiceは49言語をサポートしており日本語にも対応しています。ただし、Avalonモデルの学習データは英語中心のため、英語での精度が最も高いです。日本語の精度については公式のベンチマークは公開されていません。
Aqua Voiceの使い方 ― 導入からテキスト化まで
iOS版の具体的な操作フローはまだ公開されていませんが、デスクトップ版の使い方をベースに流れを紹介します。
🔄 Aqua Voiceの基本フロー
デスクトップ版では、システム全体の入力メソッドとして動作します。どのアプリのテキスト入力欄でも、ショートカットキーで録音を開始するとAqua Voiceが起動し、話した内容がリアルタイムでテキスト化されます。起動にかかる時間は50ms未満、テキストが表示されるまで450〜850msとかなり高速です。
たとえば、Gmailで「来週の会議について、木曜午後3時でいかがでしょうか。議題は第3四半期の予算についてです」と話すと、メールにふさわしい丁寧な文体でテキスト化されます。同じ内容をSlackで話すと、もう少しカジュアルな表現に調整されます。
カスタム辞書機能もあり、社名や専門用語を登録しておくと認識精度が上がります。無料プランでは5語まで、Proプランでは800語まで登録可能です。
料金プラン ― 無料と月額10ドルの違い
Aqua Voiceの料金体系はシンプルで、無料のStarterプランと有料のProプランの2択です。
| 項目 | Starter(無料) | Pro おすすめ |
|---|---|---|
| 月額料金 | $0 | $10/月(年払い$8/月) |
| 利用量 | 累計1,000語まで | 無制限 |
| カスタム辞書 | 5語まで | 800語まで |
| 言い間違い自動修正 | 非対応 | ✓ 対応 |
| 学生割引 | — | 年額プランが70%オフ(.eduメール必要) |
無料プランは「累計」1,000語なので、月ごとにリセットされるわけではありません。お試しで使ってみて、気に入ったらProに切り替える流れです。学生の場合、年額プランが70%オフになるため月あたり約2.4ドル(約360円)で使えます。.eduのメールアドレスが必要です。
競合のWispr Flowが月額15ドル(無料枠は週2,000語)であることを考えると、Aqua VoiceのProプラン(月額10ドル・無制限)はコストパフォーマンスの面では有利です。
使う前に知っておきたい制限
精度が高いツールですが、万能ではありません。導入前に確認しておきたいポイントがいくつかあります。
⚠️ 注意しておきたいポイント
・音声の処理はサーバー側で行われます(クラウド処理)。完全オフラインでは使えません。
・音声コマンドによる編集(「最後の文を消して」等)には非対応です。競合のWispr Flowにはこの機能があります。
・無料プランの1,000語は累計のため、日常的に使うにはPro契約がほぼ必須です。
・iOS版のリリース直後のため、App Store上での動作安定性は今後の確認が必要です。
プライバシーについては、Aqua Voiceは「オプトインしない限りサーバーにデータは保存しない」と説明しています。ただし、SOC2 Type IIやHIPAAといったセキュリティ認証については現時点で言及がありません。企業利用を検討する場合はこの点を確認しておいた方がいいでしょう。
どんな人にAqua Voice iOS版は向いているか
音声入力ツールは人を選びます。「タイピングの方が速い」という方には不要ですが、以下のようなシーンでは効果が出やすいです。
🎯 利用シーン別の向き不向き
9to5Macのレビューでは、ライターのBen Lovejoy氏が2週間で約20,000語をAqua Voiceで入力し「完全に圧倒された」と評価しています。また、アクセシビリティアドバイザーのColin Hughes氏は「キーボードが使えない人にとって人生を変えるツール」とコメントしており、身体的な理由でタイピングが難しい方にとっても選択肢になります。
毎日の入力量が多い方(ライター、カスタマーサポート、営業メール等)であれば、月額10ドルの投資は修正にかかる時間の削減で回収できる可能性が高いです。逆に、たまにSiriで短い指示を出す程度であれば、Apple標準で不自由はないでしょう。
📄 詳しいツール情報
Aqua Voice ― AIツールギャラリーの詳細ページ →




