スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

2010年上半期ニコマス20選集計方法(フェーズ2)

本エントリは、「2010年上半期ニコマス20選」の集計方法について記述しています。

フェーズ2では、作者名の判定を行います。

以下、追記です。

作業手順:フェーズ2

全データが集まったら、次に、「各動画に対するチェック」を行います。
つまり、以下のチェックを行います。
 ・作者名の判定
 ・非ニコマスチェック
 ・期間外チェック

作者名の判定:機械集計担当の事前作業

まず、機械集計担当が、各動画に対して、
 (A) 参加者が記述した作者名(重複は除く)
 (B) 動画のタグ
を列挙したデータを作成します。さらに、各動画に対して、
 (C) (A)と(B)で一致する文字列
を算出します(複数あれば列挙します)。
おわかりとは思いますが、この(C)が、多くの場合、作者名になります。
ここでは、「仮作者名」と呼ぶことにします。

(C)の「仮作者名」まで求めたら、(A),(B)を参考データとして、
動画に対する作者を調査するよう、実集計担当に依頼します。
このとき、仮作者名でソートしてから、作業を割り振るようにします。

なお、実際には、(A),(B)(そして結果(C)も)とも、
 ・英字は半角文字に統制する
 ・前後の空白(半角・全角とも)は削除しておく(トリミング)
のがよいでしょう。
「半角/全角違い」「空白の混入」は、この手の作業では、非常にやっかいな問題です。
プロポーショナルフォントのために、一見気がつかないからです。
しかし、機械集計上は別の文字列として扱われるので、非常に問題になります。
(実は、今回一部できていなくて、問題を引き起こしました。申し訳ない)

英字だけでなく、数字や一部の記号、カタカナも半角・全角の問題があります。
特に、記号については揺れやすい割に統制がしにくい
(一律全角にする/半角にすると決めにくい)ため、問題になりやすいです。
今回、英字以外の半角全角統制は、目視に頼りました。

「?P」の大文字/小文字ですが、前回までは全て大文字に統制していたのですが、
今回から、大文字/小文字の統制はしないようにしました。
参加者に作者名を書いてもらえるようになったので、判定できるだろうという判断です。

なお、このとき、「仮作者名がつかない動画」が出てきます。
これについては、人的判断担当が、作者名の判定をするのがよいでしょう。

作者名の判定:人的判断担当の事前作業

人的判断担当は、“自身が想定する判断基準”を、可能な限り明示しておきます。
今回は、以下のような方針で行いました。

 ・原則として、参加者の記述した作者名に従う
  これは主に、“作者の範囲”を決定するのに用いられる原則です。
  “作者”といっても、全く一人の方だけで作っている作品ばかりではありません。
  ボカマス作品のボカロP名は?ノベマス作品の絵師さんは?などなど、
  考え出すと/調べ出すときりがありません。
  このため、「参加者が書いていたら、こちらもそれで集計する」を原則にしました。
  もちろん、複数の参加者が異なる作者名を書いている場合もあるので、
  完全に一致するわけではありません。

 ・合作については、以下の方針です。
   ・5名までは作者名を列挙する
   ・6名以上の場合は、チーム名(もしくは相当のもの)を“作者名”とする
  チーム名が決まっていなさそうな合作については、
  こちらの方で、適当な団体名(「DJMAX合作」等)をつけさせてもらっています。
  
 ・そもそも作者名がはっきりしない場合
  ニコマスにはP名文化がありますが、特にP名を決められず活動されている方もおられます。
  このような方については、ニコニコ動画の投稿者名を作者名としました

 ・別名義
  意図的に作者名を使い分けておられる方も、お見かけすることがあると思います。
   ・動画に対する作者名の記述は、別名義のままとする
   ・作者別の得票数・動画数情報については、別名義を統合する
  というのを基本としていますが、実際、全ての別名義を調べきるのは不可能だとも思います。

作者名の判定

データと方針が確定したら、実作業担当はそれを参考にして、作者名を判定していきます。
あらかじめ、この件に対して問い合わせを集約できる場を用意しておき、
悩ましいものについては、最終的には人的判断担当が決定します。

仮作者名が付かなかったもの

仮作者名が付かなかった動画は、人的判断担当が作者名を判定しますが、
以下のチェックも同時に行います。
 ・非ニコマスチェック
 ・期間外チェック

仮作者名をつけるために動画のタグを参照するわけですが、
この情報は、AOI-CATさんのデータベースから付与します。
AOI-CATさんのデータは、「アイドルマスター」タグが付与されているものだけなので、
結果として、“「アイドルマスター」タグのない、非ニコマス動画と思われる動画”は
仮作者名が付かないものとして流れてきます。
また、AOI-CATさんのデータは、動画投稿日も分かりますので、
このタグ突き合わせの時に、期間外動画はあらかじめ除外しておきます。
これで、“期間外と思われる動画も、仮作者名が付かない”となります。
ちなみに、削除済み動画や、ニコニコ静画も、ここに流れてきます。
(どちらも集計対象です。)

P名判定と同時に、これらのレギュレーションチェックも行います。

ニコニコミュニティー内動画

実は、上記“仮作者名が付かないもの”に、ニコニコミュニティー内動画も含まれます。
ニコニコミュニティー内動画は、通常の動画とはURLが異なるので、
片っ端からコミュニティーに入って、対応するURLを調べるしかありません。
まあ、今回は、すでにそういう方が担当者でしたので、特に問題にはなりませんでしたがw

対応するURLを調べたら、以後はそのURLが集計対象となります。

敬称

公開データの作者名については、
「Pは(P自体が敬称なので)○○P」「Pでない方は○○氏」としています。
なお、参加者名については、卓球Pのブログでの記述が、
「Pは○○P」「Pでない方は○○さん」となっており、それにあわせています。

実は、今回、集計中は敬称なしで進めて、最後に「氏」をつけていきました。
必ずしも「末尾がPでないものに氏をつければよい」というわけではないので
(合作団体名などがあるため)、効率がいいわけではないのですが、
集計中も常に「氏」つきで管理していくのは、
「氏のありなしで集計がずれる」可能性が出てくるため、
それはそれで都合が悪そうです。悩ましいところではあります。

続きます

comment

管理者にだけメッセージを送る

プロフィール

グレゴール

Author:グレゴール
ニコマス厨の見る専です。

・mail / messanger:
 gregor*live.jp (*→@で)
・twitter:
 gregor_clover

最近の記事
最近のコメント
最近のトラックバック
月別アーカイブ
カテゴリー
ブロとも申請フォーム

この人とブロともになる

全記事表示リンク

全ての記事を表示する

ブログ内検索
RSSフィード
リンク
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。