(computing) In natural language processing, a set of unique shingles (contiguous subsequences of tokens in a document) that can be used to gauge the similarity of documents.
shingles
w-shingling
研究者は、ほぼ重複する文書を効率的に検出するために、文書内の連続したトークンの部分列からなる一意なシングルの集合を用いて文書を比較した。
アカウントを持っていませんか? 新規登録
アカウントを持っていますか? ログイン
DiQt(ディクト)
無料
★★★★★★★★★★