YouTubeの“推定低評価数”表示させる拡張機能は、ものすごくズレている。YouTubeチャンネルを運用して気づいた弊誌
YouTubeでは2021年より、動画の「低評価」について表示を廃止。仕様変更に伴い、第三者の手によって低評価表示を復活させるツールも登場している。しかし、そうしたツールが導き出す「低評価数」は、実際の数値とは大きく乖離している場合があるようだ。本稿では、昨年末から始動した「AUTOMATONチャンネル」などの数値と照らし合わせ、紐解いていく。
YouTube動画における高評価・低評価ボタンは、お馴染みのシステムだろう。人気動画には高評価が多く寄せられたり、物議を醸す動画であれば低評価が募ったりする仕組みだ。長らくそれぞれの具体的な数値が視聴者に表示されていた。そんな同システムについて、2021年11月にYouTubeにより仕様変更が発表。低評価数が段階的に非表示にされていった。この変更により、現在YouTubeで視聴者が確認できるのは動画の高評価の数字のみとなっている。具体的な低評価数については投稿者だけが閲覧でき、一般視聴者が知る方法はない。
「Return YouTube Dislike(以下、RYD)」は、そうした仕様変更を受けて登場したツールだ。同ツールは有志によるオープンソースプロジェクトとして開発。これをブラウザに導入してYouTubeを開くと、ツール側で低評価数を推定し表示してくれる仕組みだ。同ツールはGoogle Chromeのほか、Firefox・Edge・Opera・BraveといったPC版ブラウザにて拡張機能として利用可能だ。また、別の開発者らによるモバイル向け移植版も開発されている。同ツールはChromeウェブストアでは1万4000件に迫るユーザーレビューが寄せられ、評価は満点の5つ星。ユーザー数も300万人を超えるとされている。「低評価はやはり具体的な数字で見たい」というユーザーの需要と噛み合ってか、高い人気を博すようになったわけだ。
しかし、そんなRYDが推測して導き出す低評価数は、本当の数値から大きく乖離する場合があるとわかった。推測値が大外れとなるわけだ。筆者がその乖離に気づく発端となったのは、弊誌が昨年末から運営しているYouTubeチャンネル「AUTOMATONチャンネル」である。同チャンネルで公開されている『ハーヴェステラ』の評価を扱った動画では本稿執筆現在、RYDを導入している状態で閲覧すると低評価数が423件と表示されている。高評価数は628件であるため、かなり賛否両論という印象だ。また、動画の内容が批評的であり、実際コメント欄でも作品や動画についての賛否が多く寄せられている。リアリティのある数値のように見えるだろう。しかし、この低評価数423件に関しては、“デタラメ”と表現しても差し支えないズレ方をしているのである。
具体的な数値の開示については、YouTubeの利用規約に抵触する可能性があるため割愛させていただく。しかし、目安としてお伝えするならば、実際の低評価数は423件の10%にも満たない数字である。誤差と呼べる範疇ではなく、動画自体の好評/不評の印象さえも覆る大きな乖離といえるだろう。RYD利用者の見ている低評価数は、実際よりはるかに多い可能性があるわけだ。また、ほかの弊誌動画では、評価数の規模は比較的控えめながら「RYDが推測した低評価数より、実際の低評価数の方が5倍ほど多い」というケースもあった。実際より多くなったり少なくなったり、それぞれ逆の方向に実際の数字から乖離する可能性があるわけだ。
こうした不正確な数字が導き出される原因のひとつが、RYDが使っている低評価数の推測方法である。本ツールのFAQドキュメントでは、YouTube低評価表示廃止後に公開された動画については、以下の計算式に則って「推定低評価数」を割り出すとしている。
この計算式では、まずRYDの利用者による高/低評価の割合を算出。外部から本当の数字が確認できる高評価数を参照して、RYD利用者の低評価割合を適用しているわけだ。ここに落とし穴が発生する。この計算式が根拠にしているのは「RYD利用者の評価データ」のみであるため、低評価率が増幅される可能性が高いのだ。たとえば、高評価1000件・低評価100件が実数(実際の数)の動画があったとしよう。極端な話、この動画にRYDユーザーが100件の高評価と100件の低評価を下していたとすると、RYDユーザーに表示される推定低評価数は「高評価1000件・低評価1000件」となり、一気に実数から乖離してしまうわけだ。また、RYDを導入するユーザー自体が、動画の低評価数に価値を見出し、厳しい判断を下しやすい側面もあるだろう。筆者はこうした一連の現象が、弊誌『ハーヴェステラ』動画でも発生したと考えている。
また弊誌編集部では、同様の現象が起きているかどうか、弊社アクティブゲーミングメディアのパブリッシングブランドPLAYISMにも検証協力してもらった。同ブランドのYouTubeチャンネルの動画においても、実数の20倍ほどの“推定低評価値”が示されるものがあった。もちろん、RYDがおおむね正しいデータを提示する動画もある。ただ、同ツールの仕組み上、偶然近似したか、実数に近似するほど数多くのRYDユーザーが評価を下した場合となるだろう。
なお、弊誌では同拡張機能を利用したデータに基づく話題を記事化したことがある(関連記事)。こちらは母数が多いケースであり、データはある程度近似していたと考えられる。しかし、その後弊誌編集部では同拡張機能の数値正確性に疑問がもたれ、基本的にはソースとしない方針が取られた。今回改めて、実際に数値が大きく乖離していることを確認できたかたちとなる。そのため上述記事については、今回の検証結果を受けて本文に加筆。推定精度の低さについて新たに説明を補足追記している。以前RYDデータを取り上げたケースについては戒めとしつつ、今後も数値の正確性に気を配っていきたい。
また、RYD自体についても、「100%正確ではない」と開発側が伝えている点に留意したい。同ツールは、利用者が増えれば増えるほど正確になる性質であるとされている。つまり、開発者側も不正確なのは承知ながら、現実的な実装をしているわけだ。まずはユーザー側が、同ツールの数値は正確ではないと認識することが大事だろう。また、「低評価の数を知られてもいい」と思う動画投稿者については、以前の仕様に戻して正確な低評価数を開示できる仕組みがあってもよいだろう。たとえば弊誌AUTOMATONとしては、たとえどのような低評価数であれ、できるなら本当の数値を視聴者に提示したい、あるいは向き合いたいと考えている。批判がメディアを育てるのだ。
※ The English version of this article is available here