The researcher compared documents using w-shingling to detect near-duplicates efficiently.
研究者は、ほぼ重複する文書を効率的に検出するために、文書内の連続したトークンの部分列からなる一意なシングルの集合を用いて文書を比較した。
アカウントを持っていませんか? 新規登録
アカウントを持っていますか? ログイン
DiQt(ディクト)
無料
★★★★★★★★★★