現時点で文字起こしをさせるならAdobeの「Premiere Pro」が最適

AIの普及でかなり実用的になってきたのが「日本語の文字起こし」。各社サービスを提供していたり、Pixelシリーズでは無料でできたりします。これまでも色々試してこんな記事をも書いてますが

いまのところ精度の高さでは、Adobe「Premiere Pro」を使ったのが最適かなと思ってます。

コツとしては、Premiere Proに読み込ませた音声をそのまま文字起こしに使うのではなく、エッセンシャルサウンドで「会話」を選んで、ラウドネスを「自動一致」に設定すること。

▲エッセンシャルサウンドで「会話」を選ぶ
▲ラウドネスで「自動一致」にする

ちなみに「会話」→ラウドネス「自動一致」は、普通に動画を作るときにも有効。イベント動画などで使うと、人の声が適切な音量になります。さらにいうと、BGMをつけるときは「ミュージック」でラウドネス「自動一致」にすると、耳障りじゃない音量になるので便利。

閑話休題

ラウドネス「自動一致」をすると、波形はこんな感じ変わります。

ラウドネス「自動一致」前と後では、どれくらい文字起こし精度に差があるか、下記にテキストをアップしておきました。ちなみに元の音声はPixel 6aの本体マイクで録音したデータです。Pixel 6aの文字起こしも比較として記載しておきます。また内容は下記のYouTube動画ですが、動画の音声は別途マイク(RODE Wireless GO II)で録音してますので、文字起こしに使った音声とはデータが違います。

▲最新版はネットにつながってなくても文字起こししてくれるので便利
Premiere Pro 自動一致前Premiere Pro 自動一致後Pixel 6a
00;03;24;11 – 00;03;58;27
話者 1
はい、皆さま、こんにちは、メジャー日本文字FACEBOOKJAPAN代表のさんでございます。私は2020年の1月に入社をしてそれ以来ですね。皆様とこうやって事業説明会を行ってきたんですけれども、すべてオンラインでは行っています。今回初めてですね。メディアの皆様をオフィスに招きして、こうやってフェースツーフェースでお話しさせていただけるということで、非常にうれしく思っております。
00;03;59;02 – 00;04;32;20
話者 1
本日、よろしくお願いします。初めに、昨年の10月に我々コーポレート番号をメタに変更しました。え同時に、我々中長期的なビジョンとしてメタバースの構築を目指していくということを発表させていただきます。ただ、我々のミッションであるコミュニティー作りを応援し、人と人とをより身近になる世界を実現するというところは変えていません。
00;04;32;20 – 00;05;01;16
話者 1
これは直近の数字でございますけれども、我々が提供するプラットフォームを通じて人と人とがつながっている。そういったユーザーの数は全世界で36億人を超えました。これから我々が目指していくのはメタバース大月ですけれども、VRARを単体で作っていくということだけではなくてですね。
00;05;01;28 – 00;05;28;00
話者 1
今までのこういったプラットフォームソーシャルプラットフォームの上でもですね。メタバースを構築していく。そういった道を考えてメタが考えるメタバースということで、我々先ほどミッションをお話ししましたけれども、我々にとってメタバースというのはソーシャルテクノロジーの次なる進化であるということを考えています。
00;05;29;17 – 00;05;54;07
話者 1
どういうことかというと、メタバースを通じて先程のみそにあったようにですね。今まではできなかったような物理的な距離が離れていても、同じ空間を共有して人と人とがつながっていく。そして、未来に参加ができるそういったことをメタバースを通じて実現していきたいなと思っています。
00;05;54;07 – 00;06;32;11
話者 1
我々が考えるメタバースの特徴を3つあります。1つ目が没入感。これは今のモバイルインターネットの世界では小さなスクリーンで2次元の世界だったわけですけれども、スリーディーの没入感のある世界これがメタバースの特徴の一つだと考えています。2つ目がですね。実際にその場にいるような感覚PRESENCEと書いておりますけれども、これは先程申したように離れていても、同じ空間を共有する。
00;06;33;00 – 00;07;08;23
話者 1
それによってですね。この場にいるような感覚。そこは聞いたん重要かなと思います。最後は相互運用性インターオペラビリティを考えています。これは、現在のモバイルインターネットの中でもんです。アプリケーションの閉じられた世界で、アプリケーション同士っていうのは1度閉じて次何という世界ですけれども、メタバースにおいてはアプリケーションプラットフォームを超えて、例えばアバターができるデジタル物が持っていける。
00;07;09;14 – 00;07;39;20
話者 1
そういったことを実現したいというのが、メタバースの特徴の為に考えています。メタバースによる新しいソーシャル体験ですけども、現在ゲームエンターテイメントフィットネスというところが目に前に使われているエリアになっていますけれども、今後仕事であると教育、そして福祉そういったことに広がっていくのではないかなと思います。
00;03;24;11 – 00;03;58;26
話者 3
はい皆様、こんにちは、また、日本文字FACEBOOKJAPAN代表のさんでございます。私は2020年の1月に入社をして、それ以来皆様とはこうやって事業説明会を行ってきたんですけれども、すべてオンラインでは行っています。今回初めてですね。メディアの皆様をオフィスに招きして、こうやってフェースツーフェースでお話しさせていただけるということで、非常にうれしく思っております。
00;03;59;02 – 00;04;32;20
話者 3
本日、よろしくお願いします。初めに、昨年の10月に我々コーポレート番号をメタに変更しました。同時に、我々中長期的なビジョンとしてメタバースの構築を目指していくということを発表させていただきます。ただ、我々のミッションであるコミュニティー作りを応援し、人と人とをより身近になる世界を実現するというところは変えていません。
00;04;32;20 – 00;05;01;15
話者 3
これは直近の数字でございますけれども、我々が提供するプラットフォームを通じて人と人とがつながっている。そういったユーザーの数は全世界で36億人を超えました。これから我々が目指していくのはメタバース構築ですけれども、VRARを単体で作っていくということだけではなくてですね。
00;05;01;27 – 00;05;34;16
話者 3
今までのこういったプラットフォームソーシャルプラットフォームの上でもメタバースを構築していく。そういった道を考えています。メタが考えるメタバースということで、我々先ほどミッションをお話ししましたけれども、我々にとってメタバースというのはソーシャルテクノロジーの次なる進化であるということを考えていますが、どういうことかというと、メタバースを通じて先程のみそにあったようにですね。
00;05;35;29 – 00;05;57;04
話者 3
今まではできなかったような物理的な距離が離れていても、同じ空間を共有して人と人とはつながっていく。そして、好きに参加ができるといったことをメタバースを通じて実現していきたいなと思っています。我々が考えるメタバースの特徴を3つあります。
00;05;58;25 – 00;06;24;21
話者 3
1つ目が没入感。これは今のモバイルインターネットの世界では小さなスクリーンで2次元の世界だったわけですけれども、スリーディーの没入感のある世界これがメタバースの特徴の一つだと考えています。2つ目が実際にその場にいるような感覚プレゼンスと書いております。
00;06;24;21 – 00;06;49;25
話者 3
けれども、これは先ほど申したように離れていても、同じ空間を共有する。それによってですね。この場にいるような感覚。そこは聞いたん重要かなと思います。最後は相互運用性インターオペラビリティを考えています。これは、現在のモバイルインターネットの中でもんです。
00;06;50;20 – 00;07;17;26
話者 3
アプリアプリケーションの閉じられた世界で、アプリケーション同士っていうのは1度閉じて次何という世界ですけれども、メタバースにおいてはアプリケーションプラットフォームを超えて、例えばアバターが行き来できるデジタル物が持っていける。そういったことを実現していくというのが、メタバースの特徴の為に考えています。
00;07;17;26 – 00;07;47;11
話者 3
メタバースによる新しいソーシャル体験ですけども、現在ゲームエンターテイメントフィットネスというところがメインで使われているエリアになっていますけれども、今後仕事である教育、そして福祉そういったことに広がっていくのではないかなと思っています。

はいええ皆様こんにちは。えーネタ日本法人 Facebook JAPAN 代表のございます。えっと私あの 2020 年の 1 月に入社をして、それ以内ですね。えー皆様とこうやってですね。あのー事業説明会を行ってきたんですけども、全てオンライン今まではえー行っていました。
で、今回初めてですね。えー、メディアの皆様をえーオフィスにマネキしてえー! こうやってフェイス 2 ペースですね。お話えーさせていただけるということでえ、一緒にえー嬉しく思っております。ええ、本日えー! よろしくお願いします。
始めんですね。ええ、昨年の 10 月に我々コーポレートブランドをえーメタに変更します。同時にですね。我々えー中長期的なビジョンとしてえーメタ VANS の構築をえー目指していくということを発表させていただきました。
ただですね。我々のミッションであるえーコミュニティ作りを応援し、人と人とをえーがより短がある世界を実現するというところは変えておりません。あれ、直近のえー数字でえーございます。けれどもえー我々が提供するえー。
プラットフォームを通じてですね。ええ、繋がっているえーそういったユーザーの数はですね。全世界で 36億人をえー超えました。でえー。これからですね。我々は目指していくのはえーメタ版お付きですけれどもえー VR AR えーを単体でこう作っていくっていうことだけではなくてですね。
ええ、今までのえー、こういったブラックコンボスペシャルプラスフォームの上でもですね。えーネタバンスをえーいうそういったえー。どう考えてメタンが考えるメタバースということでえー。我々先ほどミッションを話しますけども、我々にとってえーメタバースというのは、ソーシャルテクノロジーのえー、次なる進化ではないということを考えています。
いや、どういうことかと言うと、えーメタバーツを通じて先ほどのミッションにあったようですね。えー、今まではできなかったようなえー。物理的な距離がこう離れていても同じ空間共有してえー 1 つ人とは繋がっていく。
そして、 A コミュニティに参加ができるそういったことをえーネタバスを通じてえー実現していきたいなと思っております。
我々には考えるメタバースの特徴 3 つあります。最後はですね。えー総合運用性ええ! インターベラビリティとえーえー! これはですねえー。現在のえーモバイルインターネットの中ではですねえーアプリケーションにこう閉じられた世界になっているで、取り計算ドスっていうのは一度閉じて次のアプリでいう世界でした。
けども、えーメタワースにおいてはアプリケーションプラスフォンも超えたですね。えー、例えばアバターが引きできるえーデジタル別がえー持っていきやるとえーそういったことをえー。実現していくというのがメンバーますの特徴となっていう風に考えてます。
メタロスによるえー、新しいソーシャル体験ですけどもえー現在えーゲームエンターテイメントえーフィットネス」っていうところが、あのメインで使われてるエリアになっていきますけども、今後えー仕事であると教育、そして福祉えー、そういったことにえー広まっていくのではないかなと思います。

Pixelも悪くないんですが、「えー」とか「あのー」とか、いわゆる「ケバ取り」ができてない素起こしな感じ。いっぽうPremiere Proのほうは、ケバ取りがされてて、文章としても読みやすい感じです。

さらに会話→ラウドネス「自動一致」をさせたほうが、ケバ取りと変換精度が若干上かなと。音デカすぎて割れると認識率下がりますが。

というわけで、精度的にはPremiere Proかなって感じです。ただPCが必要だし文字起こし作業が必要なので手間は手間。その点、Pixelシリーズはその場で文字起こししてくれるし、起こした文字をタップ・クリックして聞き直すってこともできるのは便利。

なのでオイラは、本格的な文字起こしが必要な場合はPremiere Proで起こしつつ、確認はPixelで起こしたのを使って再生って組み合わせて使ってます。というわけで現場でのPixel録音はマストっす。

旅人ITライターさとる
旅人ITライターさとる

自分の仕事の効率化・最適化を追求するあまり、仕事が手に着かないさとるです

コメント

タイトルとURLをコピーしました