メルマガ読むならアプリが便利
アプリで開く

週刊 Life is Beautiful 2022年2月1日号:Netflixと放送革命の最終章、Voicy はじめました

週刊 Life is beautiful
今週のざっくばらん Voicy はじめました 少し前に、音声プラットフォームの Voicy の運営会社から、Voicy で発信しませんか、という連絡が来ました。Voicy の存在は知っていたし、Podcast 的なことは前からやりたいと思っていたので、ちょうど良い機会とも思ったのですが、ただでさえ、(メルマガ、mmhmm、netdronesと)三つの仕事をしていて忙しいのに、さらに仕事を増やして良いものかと悩んでいました。 すると再度、担当者から「ご検討いただけましたでしょうか」との連絡が来たので、Zoom 会議で話し、「メルマガの宣伝にもなりますから」と背中を押される感じでとりあえずスタートしてみました。 実際に、コンテンツを作ってみると、アプリが良く出来ているため、予想していたよりもはるかに簡単で心地良く、リスナーからの反応も良いので、これならば続けられそうです。 Voicy が Podcast と大きく違うのは、「コンテンツ作りの手軽さ」と「リスナーの体験の心地よさ」の両立をするための細かな工夫がされている点です。 コンテンツ制作者に対しては、あえて編集機能を絞り込むことにより、「一発収録」を促すような設計になっているし、リスナー側には、Podcast のような作り込んだコンテンツではなく、一昔前の深夜放送のような「生の声が聞ける」雰囲気を重視する設計になっているのです。 そのため、私のような初心者でも、20分のコンテンツを40分ぐらいで作ることが可能で、慣れてくれば「20分のコンテンツを25分で作る」ことも十分に可能だと思います。 一つだけ問題なのは、iPhone のマイクが(内臓のものも AirPod Pro も)周りの雑音を拾ってしまう上に、風の音が入ってしまう点で、「海岸の散歩」とか「ゴルフの練習」をしながら収録することが難しい点です。iPhone 用の外付けマイクで、屋外での収録に適したものを見つける必要があると感じています。 人工知能最前線:NeRFの進化 NeRF(Neural Radiance Field) については、2021年8月31日号で紹介しましたが、その後、すごい勢いで技術が進歩しており、追いつくのが大変です(NeRF について初耳な人は、「NeRF: Neural Radiance Fields」という Youtube ビデオを見ることをお勧めします)。 NeRFは、「3次元空間を記録し再現する技術」の一つです。良くある応用例が、スマホやドローンを使って物体や建物をさまざまな方向から撮影し、その一連の画像から、コンピュータ内の3次元空間にその物体や建物を再現する、デジタル・ツインと言われるものです。 NeRF 以前は、複数の写真から共通する特徴点を見つけ出し、それらの深さ情報(カメラからの距離)を予測した上で、3次元空間上のポリゴンを求める、という方法でデジタル・ツインを作っていました。現時点で、市場に出ているスマートフォンアプリは、基本的にこの手法で作られています。 この方法は、同じくポリゴンの集まりで3D空間を表示する3Dゲームなどと相性が良いのですが、ポリゴンの精度に限界があるのと、ワイングラスに注がれた白ワインのように半透明なものを処理することが出来ないのが問題でした。 NeRFは、特徴点やポリゴンを一切使わず、「どう見えるか」だけに着目して処理するため、凹凸が多数ある物体、半透明なもの、見る角度によって色が変わるもの、などを忠実に再現出来る点が優れているのです。 しかし、当初発表された NeRF は、ニューラルネットワークのトレーニングに数日かかるし、3D空間の描画(レンダリング)もリアルタイムでは出来ませんでした。 しかし、わずか2年の間にさまざまな研究が行われました。下のリストはそのごく一部です。UC Berkeley の研究者が NeRF のリアルタイム描画に成功(PlenOctrees: For Real-time Rendering of Neural Radiance Fields)University Washington の研究者が対象が少しぐらい動いても NeRF が生成できる手法を作成(Nerfies: Deformable Neural Radiance Fields)UC Berkeley の研究者が、ニューラルネットワークなしで、10数分で NeRF の生成に成功(Plenoxels: Radiance Fields without Neural Networks)Snapの研究者がオンライン上の画像から3Dモデルを作るのに成功(NeROIC: Neural Object Capture and Rendering from Online Image Collections)Nvidia の研究者が、トレーニング時間を数秒に短縮(Instant Neural Graphics Primitives with a Multiresolution Hash Encoding) 最後のものは、先週発表されたばかりのものですが、なんとトレーニング時間を数秒にまで短縮してしまいました。 私は長らくこの業界にいますが、技術がこれほどのペースで進歩するのを見たことがありません。深層学習というテクニックが新たな道具を人類に与えたから、というのもありますが、全ての研究者がオープンな形で成果をどんどんと発表してしまっている点(どの論文も無料で読むことが出来るし、多くの場合、ソースコードも公開されています)もこのスピードに大きく貢献しています。 人類は、誰かが何か革新的なものを発見・発明すると、それによりアクセス可能になった「新たな領域」に人類全体が踏み込み、そこで一気に技術が進むことがありますが、私たちはそれをまさに目撃しているのです。

この続きを見るには

この記事は約 NaN 分で読めます( NaN 文字 / 画像 NaN 枚)
これはバックナンバーです
  • シェアする
まぐまぐリーダーアプリ ダウンロードはこちら
  • 週刊 Life is beautiful
  • 「エンジニアのための経営学講座」を中心としたゼミ形式のメルマガ。世界に通用するエンジニアになるためには、今、何を勉強すべきか、どんな時間の過ごし方をすべきか。毎週火曜日発行。連載:菅首相に会って来た/米国で起業する時に知っておかねばならないこと。
  • 880円 / 月(税込)
  • 毎週 火曜日(年末年始を除く)