「コピペしていないのに、コピペ率が高いと言われた!」
「一致率が下がらない!」
ライターをしていると、よく遭遇するトラブルですよね。
この記事では、コピペ率チェックでよく使用される『CopyContentDetector』で一致率が高くなる原因と、具体的な解決方法を紹介します。
そもそもコピペチェックはなぜ必要?
コピペチェックが必要な理由は、次の2つです。
- コピー元から著作権侵害で訴えられる!
- Googleからペナルティを受けるリスクがある!
コピペ記事を公開すると、サイト所有者(クライアント)がコピー元から損害賠償請求されるリスクがあります。
また、Googleは重複コンテンツを嫌うので(参考)、コピーコンテンツだと判断されれば下記のようなペナルティを受けます。
- 記事がGoogleにインデックスされない
- サイトの検索順位を下げられる
サイトとして致命傷ですね!
コピペ記事と知らずに公開してしまう悲劇を避けるため、コピペチェックをしないクライアントはまずいないでしょう。
そのため、ライター側も納品前のコピペチェックが必要になるわけです。
コピペチェックツールといえば『CopyContentDetector』
コピペチェックツールは複数ありますが、有名所は株式会社ウェブサークルの『CopyContentDetector』(コピーコンテンツディテクター)、通常CCDと言われるサイトです。
- 無料プランでも4,000字までチェックできる
- 検査時間は1~3分くらい
- 回数制限なし
4,000字以上の長文でも、分割でチェックすれば問題なく使えます。
一致率?類似率?検査結果の見方を解説
個人の無料ユーザーがCCDで検査できるのは、次の3項目です。
検査項目 | 内容 |
---|---|
類似度 | Web上に似ている文章がないか判定 |
一致率 | Web上の記事と、単純に一致している箇所を計算 |
テキスト類似度 | 今まで登録した文章との類似度を判定 |
「コピペ率」と言うときは、類似度と一致率の両方を合わせて言っていることが多いでしょう。 一見同じに見えますが、この2つは検査方法が異なります。
例えば「むかし浦島は助けた亀に連れられて、竜宮城に行きました。」という、Web上のどこかにありそうな文章をチェックすると、もちろん類似度も一致率も高くなります。
これを「むかし浦島に助けられた亀は、彼を龍宮城へ誘いました。」と書き換えると、類似度は良好(グリーン)に下がります。しかし、「浦島」や「亀」などの単語は同じなため、一致率は高いままです。
実際にライターをやっていると「類似度は低いのに一致率が高くなる」というパターンがよくありますよね。
これは、CCDの一致率計算そのものが「同じ単語を使えば文脈に関係なく上がる」仕組みになっているためです。
一致率はどこまで下げるべき?
では、一致率はどこまで下げるべきなのでしょうか? これは納品するクライアントによって異なります。
- 一致率が50%未満(良好)ならOK
- 30%以下でないとだめ
- CCDではないツールでチェックしている など
クライアントによって”コピペ率”の考え方が違う点に注意しましょう。
そもそも、Googleがどのような基準で重複コンテンツをチェックしているかはブラックボックスです。しかし「CCDの一致率が高いからといって即アウトではない」とは噂されています。
実際、この記事を書く際のリサーチで、上位の記事同士が一致率60%を越えている状況に遭遇しました。
もちろん、類似率・一致率ともに低い状態が望ましいことは変わりません。 特に、体験談のようなオリジナリティが出しやすい記事は、コピペ率が低くて当たり前ともいえます。
しかし、どのジャンルやテーマでも過度に低い一致率を要求してくるクライアントは、少し注意!ライターが無駄に消耗させられる危険があります。
一致率が高くなる原因
よくある一致率が高くなる原因は、下記3つです。
- そもそも一致率が高くなりやすいジャンル
- 記事のオリジナル要素が薄い
- コピペ&リライトで書いている
一致率が高くなりやすいジャンルで書いている
いつも通りに書くだけで、コピペ率が高くなりやすいジャンルが存在します。
- クレジットカード、金融商品、物販などの収益性が高いジャンル
- 人気商品やサービスの申し込み方法・使い方の紹介
- 法律関係 など
記事が収益につながりやすいレッドオーシャンなジャンルは、すでに網羅性の高い記事が多く存在しているため、一致率が高くなりやすいです。
また、方法の解説記事のように「誰が書いてもそうなる」「他に説明しようがない」ものも、一致率が高くなりやすいでしょう。
さらに、法律の解説記事のような、キーワード、解説文ともに使う単語を変えようがないジャンルも、一致率との戦いになります。
記事にオリジナル要素が薄い
記事にオリジナル要素が少ないと、一致率が高くなります。
「オリジナル要素=他の記事が使っていない単語を使用する部分」ともいえますね。
同じ商品の紹介記事であっても、基本性能だけ書いた記事は一致率が高くなり、使用感や感想を追加した記事は一致率が低くなります。
「一致率が高いからコピペ」とは断言できません。
しかし、どのジャンルでも一致率が高くなるような方は、文章に意識して自分の言葉を入れてみましょう。
コピペ&リライトで書いている
詳しくないジャンルの記事だと、上位記事の一部をコピーして書き直したり、2窓表示で参考にしつつ書いたりしますよね。
この方法は、無意識に参考記事と同じ単語を使いやすく、一致率が上がりやすい書き方です。
リサーチ段階で理解を深め、執筆中は他サイトをあまり見ずに書くことをおすすめします。
どうしても難しい場合は、意識して別の単語を使うなど、執筆段階で工夫しましょう。
一致率を下げ、コピペ判定を回避する方法
どれだけ注意しても、一致率が50%超えることはあります。 具体的な一致率の下げ方をご紹介します。
- キーワードを削る
- 一致率の高い段落を書き直す
- 感想・体験談・例文でオリジナリティを出す
- 一致判定になっている言葉を書き換える
キーワードを削る
もっとも簡単なのが、一致率を上げているキーワードを削ってしまうことです。
「詳細表示」→「一致率判定詳細」を見ると、一致と判定されている箇所を確認できます。
例の場合、「浦島」や「助けられた亀」がマークアップされています。よって「浦島」を削れば一致率が下がります。
すべてのキーワードを削るのは現実的ではありませんが、なくても意味が通じる箇所はキーワードを省略すると、記事全体を大改造せずに一致率を下げられます。
一致率の高い段落を書き直す
一致率判定の詳細をみると、一文すべて、または段落の大部分が一致と判定されていることもあります。CCDは助詞や語尾まで一致の判定に含めるので、ままあることです。
全部赤くマークされてしまったら、その文章は削除してしまうのが手っ取り早いです。
身も蓋もないですが、一致率を下げる王道の方法です。
文字数が足りないなら、一致率が高いと判定されたサイトにはない情報を追加しましょう。
感想・体験談・例文でオリジナリティを出す
「一致率が高い箇所は、記事に必要な部分だから削れない」という場合は、オリジナル要素を追加して、記事全体で一致率を下げるしかありません。
- 感想
- 体験談
- 例文 など
これらを、入れられる場所にどんどん追加していきます。
例えば商品レビューの場合、販売会社や商品スペックの情報は必要ですし、一致率も下げられませんよね。
そこで、
- パッケージの感想
- 使用感
- 繰り返し使ってみた印象
といった文章を追加すると、他の記事には使われていない言葉が入り、一致率が下がります。
オリジナル要素があるほうがSEOにも高評価のため、これも王道の方法といえます。
一致判定になっている言葉を書き換える
あまり記事を変更したくない場合のテクニックも紹介します。
- 同義語に書き換える
- こそあど言葉を削る/足す
- 漢字を閉じる/開く
- 語尾を変える など
小手先の手法なので、大幅な一致率の低下は期待できません。
しかし、「あと数%なのに!」「もう記事を変えたくない」といった場合には、ぜひ試してみてください。
同義語に書き換える
特にキーワードと関係ない表現なら、同義語に置き換えます。
- 「一致率が高い」を「一致率が大きい」「一致率に引っかかる」などにする
- 「/」や「¥」などの記号がマークアップされていたら、「・」や「円」に置き換える
ただし、記号を置きかえる場合はレギュレーションに注意してください。
こそあど言葉を削る/足す
「これ」「それ」などのこそあど言葉がマークアップされていることもあります。
こそあど言葉は、Web文章では使わないほうがよい表現でもあります。積極的に削りましょう。
逆に「キーワードを削りたいけれど、主語は必要」という場合は、こそあど言葉で言い換えるのも1つの手です。
わかりやすい文章からは遠ざかるため多用は推奨しませんが、手段の1つとして紹介しておきます。
漢字を閉じる/開く
「一致率が高い」を「一致率がたかい」にすると、一致判定から外れます。
一致率は、単純な単語の一致を見ているだけだからです。
- 漢字を閉じる:ひらがなを漢字にすること
- 漢字を開く:漢字をひらがなにすること
漢字↔ひらがなの変換だけで、一致率は下げられます。全体的な漢字使用率や、レギュレーションとバランスを取りつつ試してみてください。
語尾を変える
語尾の「です」「ます」が一致判定をうけている場合は、語尾を変えれば解決することもあります。
「~と言えなくもありません」のような長い表現が引っかかっているのなら、「~です」と言い切ったほうが、一致率は少し下がります。
納品前・公開前はコピペチェックを忘れずに
納品前に、記事のコピペチェックを忘れずに行いましょう。
CCDの結果とGoogleの重複コンテンツ判定は、別物ではあります。しかし、コピペ率が要注意判定以上の記事をしれっと納品するのは、あまり気持ちのよいものではありません。
コピペチェックは、ライターのモラルです。
ただし、一致率だけでコピペと決めつけてくるクライアントには要注意。
ライター側も「類似度が高い」「一致率が高い」がどういう状態なのかを把握しておくことが大切です。