現状の課題: 現在、API原価は 月額 約2,700円。今後のスケールを見据え、ストック型ビジネスモデルへの転換と、原価の大幅削減を目指す。
1. Google Cloud STT 「Dynamic Batch」への移行
「1日の出来事をまとめて振り返る」というユースケースに最適な、遅延許容型の処理を導入します。
- 仕組み: 最大24時間以内の処理を許容することで、通常料金の 約75〜80%オフ が適用されます。
- 期待効果: 文字起こしコストを数百円単位まで圧縮可能です。
2. 音声認識エンジンの比較・乗り換え
Google Chirp以外の低価格・高精度エンジンへのリプレイスを検討します。
| サービス名 |
コスト目安 |
特徴 |
| Deepgram (Nova-3) |
約$0.0043/分 |
Googleの約1/4の価格。推論速度が非常に速い。 |
| Groq (Whisper API) |
2026年時点最安級 |
LPUによる圧倒的な推論速度。コスト効率が極めて高い。 |
| OpenAI Whisper |
$0.006/分 |
精度は安定しているが、他社よりは割高。 |
3. 施設導入を見据えたローカルサーバー運用
介護施設等への法人導入時は、プライバシー保護と原価ゼロを両立させます。
- 構成: NVIDIA GPU搭載PCを施設に設置し、faster-whisper や Whisper.cpp を実行。
- メリット: API課金がゼロになり、データが外部に出ないため「安心・安全」を付加価値にできます。
4. データ加工による課金対象の削減
APIにデータを送る前の「前処理」を徹底します。
[cite_start]- VAD(発話区間検出): サーバー側で無音時間を完全にカットし、純粋な会話時間のみを課金対象にします [cite: 172, 174]。
[cite_start]- 圧縮形式の最適化: WAVから MP3 や OPUS に変換し、通信・ストレージコストを削減します [cite: 174]。
5. 要約LLMのコスト最適化
[cite_start]- Gemini 1.5 Flash: 現行の主力モデル。コスパに優れる [cite: 381]。
- Gemini 2.0 Flash: 2026年時点の最新。より低価格・高精度な要約が可能。
- DeepSeek-V3: オープンソース系。自社サーバー運用時に極めて低コストで推論可能。
「AIメモたん」は、単なる便利ツールではなく、高齢者と家族に『安心』を届けるインフラです。原価を抑えつつ、デイサービス等との提携を通じてストックビジネスとしての柱を構築します。