このサイトはWebfile便で作成しました利用はこちら

VoiceMemoLM 操作ガイド

VoiceMemoLM(GaibuKiokuSouchi)は、音声メモを取り込んで文字起こし・要約を自動生成し、Markdown と音声の両方を活用しながら知識を蓄積できる iOS アプリです。迷わず操作できるよう、各画面の流れとコツをまとめた公式チートシートです。

アプリ全体の流れ

VoiceMemoLM は、音声の取り込み → Markdown 化 → 知識検索・活用 の 3 ステップで構成されています。

  1. ClipView で音声ファイルまたはフォルダをインポートすると、自動で文字起こしと要約が走り、Markdown が生成されます。
  2. FileView で生成された Markdown を一覧・検索・リネームし、波形と同期しながら内容を再生できます。
  3. AskView で蓄積した Markdown をまとめて参照しながらチャット形式で質問できます。業務ノートや会議録のナレッジベースとして活用できます。
ポイント: 生成された Markdown はアプリの Documents/Markdown フォルダに保存され、FileView から直接操作できます。GitHub への自動 push や Pull Request 作成も対応しているため、チーム共有にも応用できます。

初期設定と環境準備

初回起動時に確認する項目

設定画面(歯車アイコン)で整える内容

ClipView と FileView の右上にある歯車アイコンから SettingsView を開けます。主な設定項目は以下の通りです。

カテゴリ 主な設定内容 補足
要約モード ローカルモデル / クラウド(Gemini API)を切り替え クラウド利用時は Gemini API Key を Keychain に保存します。
WhisperKit 詳細設定 モデル選択、タイムスタンプ、無音カット、デコーダプレビューなどの ON/OFF ClipView の処理品質や速度に直結します。迷ったらデフォルトのままで問題ありません。
Git 連携 リポジトリ URL、保存ディレクトリ、トークン保存、PR 自動作成の可否 GitHub Actions 等で自動アーカイブしたい場合に有効です。

設定を保存すると次回以降の処理に即時反映されます。特に 無音カットタイムスタンプの有無 は ClipView の挙動に影響するので、業務用途に合わせて調整してください。

ClipView(Clip/Transcribe タブ)の使い方

ClipView は音声ファイルをまとめて処理する中心画面です。アプリのタブバーで Clip(表示タイトルは Transcribe)を選択すると表示されます。

基本フロー

  1. 画面上部の Reset アイコンで状態を初期化し、前回の選択をクリアできます。
  2. インポート ボタンを押すとファイルピッカーが開き、音声ファイル(複数選択やフォルダ選択も可能)を追加できます。選択が完了するとファイル一覧が内部にコピーされ、自動的に処理がスタートします。
  3. 選択後は確認ダイアログが表示され、必要に応じて「リセット」でキャンセル可能です。特に問題がなければそのまま待機します。
  4. 画面中央の円形プログレスとテキストで進捗が確認できます。
    例:「バッチ処理中」「バックグラウンドで実行中」 といったステータスが表示されます。
  5. 右上の小さなプログレスインジケータでステータスを常時確認できます。処理中はタスクキルせず、アプリを前面またはバックグラウンドで待機してください。
  6. 処理完了後はダイアログで通知され、「OK」を押すと FileView へ移動して生成された Markdown を開けます。

画面内の操作パーツ

処理内容の概要

ClipView では以下の処理が順番に実行されます。

ヒント: 音声ファイルは一度アプリ内の処理用フォルダにコピーされてから解析されます。コピー中は「インポート処理中」と表示されるので、完了するまでアプリを閉じないようにしましょう。

FileView(ファイル管理タブ)の使い方

FileView では生成された Markdown を一覧し、詳細を確認・編集できます。タブバーで File を選択すると表示されます。

一覧画面のポイント

Markdown 詳細画面

AskView(質問タブ)の使い方

AskView は蓄積した Markdown を文脈として活用しながら質問できるチャット画面です。タブバーで Ask を選択します。

チャット一覧画面

チャット詳細画面

質問の仕組み: 選択した期間に含まれる Markdown を MarkdownAggregator が読み込み、最大 30,000 文字まで要約を連結したうえでクラウドの LLM に問い合わせます。会話履歴も自動送信されるため、複数ラウンドの質問でも文脈が維持されます。

SettingsView(設定タブ)の使い方

ClipView と FileView の右上にある歯車アイコンから SettingsView を開きます。Sources/View/SettingsView.swift に定義されている各種設定は、以下のカテゴリで整理されています。

文字起こし・要約のコア設定

デコーディング詳細とパフォーマンス

Gemini / Git 連携エリア

操作のヒント: 設定値は即時反映されます。高負荷なモデルを利用する場合は Compute Units を cpuAndNeuralEngine へ戻す、または openai_whisper-small など軽量モデルへ切り替えると安定します。

Gemini / Google API Key の設定方法

Gemini を使ったクラウド要約を有効化するには、Google が提供する API Key を取得し、アプリに保存する必要があります。

API Key の取得手順

  1. Google Cloud Console にアクセスし、Google アカウントでログインします。
  2. 画面上部のプロジェクトセレクタから既存プロジェクトを選ぶか、新しいプロジェクトを作成して Gemini 用のワークスペースを用意します。
  3. 左上のハンバーガーメニューから API とサービス > ライブラリ を開き、検索欄で「Vertex AI API」(または「Generative Language API」)を検索して 有効化 します。
  4. API とサービス > 認証情報 を開き、認証情報を作成 > API キー を選択します。生成されたキーがダイアログで表示されるのでコピーして安全な場所に控えます。
  5. 必要に応じて キーの制限 を設定し、API の利用先を Vertex AI API に限定すると安全性を高められます。

VoiceMemoLM への登録

  1. アプリで SettingsView を開き、Gemini API Key の入力欄に取得したキーを貼り付けます。
  2. Save ボタンを押すと Keychain に暗号化保存され、「保存済み」バッジが表示されます。
  3. 要約モードを「Gemini」に切り替えて、AskView や ClipView の要約がクラウド経由で動作することを確認します。
セキュリティのコツ: API Key は Keychain に保存されるためアプリ外へ漏れにくい構造ですが、不要になった場合は SettingsView から削除しておくと安心です。

GitHub 連携の手順

Git 連携を活用すると、生成した Markdown や音声ファイルを GitHub リポジトリへ自動同期できます。SettingsView の GitHub Integration ブロックから設定します。

事前準備

アプリ側の設定

  1. SettingsView の GitHub Integration をオンにし、Repository URLSave Directory を入力します。
  2. GitHub Token の欄に Personal Access Token を貼り付け、Save で Keychain に保存します。保存済みの場合は「Saved」と表示されます。
  3. 必要に応じて Create Pull RequestCreate PR on File Update を有効にし、Push のたびに PR を自動作成するかどうかを選びます。

運用時のポイント

トラブル回避: 企業ネットワークでは SSH ではなく HTTPS を推奨します。https://github.com/<org>/<repo>.git 形式を指定するとファイアウォールを避けやすくなります。

日常運用のモデルケース

  1. 会議終了後: 会議の音声を ClipView でインポートし、無音カットとタイムスタンプを有効にした状態でバッチ処理を実行します。
  2. レビュー: 処理が完了したら FileView で Markdown を開き、タイトルを会議名にリネームします。必要であれば要約本文に追記します。
  3. 共有: Git 連携を有効にしている場合、Push/PR が完了した旨のダイアログが表示されるので、そのまま GitHub で内容を確認します。
  4. 後日検索: AskView の日付範囲を会議日付に合わせ、決定事項や経緯をチャット形式で検索します。

ヒント・トラブルシューティング

それでも解決しない場合は、SettingsView のログ共有機能からログをエクスポートし、開発チームへ共有してください。