スキップしてメイン コンテンツに移動

【オリジナルコンテンツと検索エンジンへの上位表示について…機械的な側面】

【オリジナルコンテンツと検索エンジンへの上位表示について…機械的な側面】

この投稿は、日本時間の2017年から2018年の現在、こと6月の8日と同13日に、メッセンジャーに宛てた雑記を、ブログ用に直したもので、それに、googleのガイドラインや、調べたり経験をしたことを加えたものです。

この読み物では、オリジナルコンテンツというものと、google検索エンジンへの上位表示というものを、機械的な側面から考えています。

さて、最近、といっても、何年も前からですも、SEO、つまり、検索エンジン最適化界隈のかたは、よく、

独自性のあるコンテンツを〜

などと謳っていますが、少し考えて下さい。

  • googleは、クローラーというものが、WEBの巡回(という表現です)をしているわけです。

googleは、クローラーが持ち帰ったページの情報を、《何百もの要因でふるいにかけて、検索エンジンに表示がされる順位を決定しているようです。》

例えば、あるブログなり、サイトなりがあったとして、それが日本語且つhtmlで書かれていた場合のことを考えてみると、googleクローラーがみているものの幾つかは、

  • 単語
  • 単語の出現頻度と、重み出現間隔
  • 国文法の《》《》《
    (どれほどかは分かりませんが、みているはずです。)

というようなものがあります。

ここまでで、少し書かせて頂きますや、《検索エンジン最適化》という言葉は、

  • 検索エンジンを最適化する。

という意味合いではなくて、

  • 検索エンジンに対して、ページなどを最適化する

という意味で、言葉の綾と言うか、そういった界隈のかた以外にも、大体にして分かることから、大方の人は、故意に縮めているわけです。

また、ここまでで言うところの、googleのクローラーが観ている。とした表現は、お気付きかもしれませんも、あくまで人間側からした観えかたで、実際には、下に記すように、そういったものではありませんが、取り敢えずの説明のしやすさを加味をしての記述です。

少し専門的な話になりますが、日本語というか、漢字平仮名というものは、《2バイト文字》と呼ばれるもので、ローマ字などとは、文字を表現する記憶の格納領域に多少があり、これを、

  • 文字コード

というものを使って、表わしています。

色にしても、色を表わすコードがあります。

ですので、例えば、端末の画面に表示がされているそのままを、コンピューターが理解をしているわけではなく、最終的には、2進数となるわけですが、とどのつまりは、

  • コンピューターが、意味が理解をできていなくても、訪問者に、観せることはできる

ということで、これは、

  • 自考自立型ではないですから、日本語の意味が理解をできていなくても、日本語のフォントを、端末に表示をすることができる。

という意味です。

それで、考えることは、次です。

googleのクローラーは、

  • 日本語を観ていると思いますか?
  • 文字コードを観ていると思いますか?

最近、といっても、何年も前からですが、規格が良くなって、文字化けをすることは、滅多にお目にかからなくなったんですが、それでも、偶に、そういったことがあるわけで、その時に、上記のようなことを、ふと思ったわけです。

そうです。

文字化けをしていても、コンピューターの内部的には、エラーがなく、文字化けをしたままで、表示をするわけです。

*本来であれば、次の文字や、となる場所にまで、記憶領域が溢れていますので、オーバーフローをしているわけです。
内部的には、全く別の記憶領域に溢れていることになります。

つまり、自然言語での検索であろうと、人間が言うところの、日本語を観ているわけではないんです。

それから、googleニュースについてのことを考えてみると、PDFという規格で、インターネットに公開をしていると、googleのクローラーは、そのファイルの中にある文字が読めないんです。

*少し前のことですから、現在については、詳細は分かりませんが、ガイドラインだったかを読むと、《PDFは読めない》旨しっかりと書いてあります。

このことから、googleのクローラーは、せいぜい、これはPDFという規格のファイルである。ということが分かって、端末に、その中で使われている言語での表示はできる。くらいであると思います。
こうと思ったのは、別記をする、もっと順位が高くてもいいはずの、サイトの順位が、PDFで公開をしている為からか、低いからです。

*本来であれば、おかしなリンクを付けずとも順位が高いはずの、官庁などのサイトが低いのであれば、これも、原因のひとつに挙げられると思います。

*ここでは、PDFが嫌と言っているわけではなくて、googleの規格に沿うほうが、上位に表示がされやすい。としているだけです。

事実、昔は私も、texを使って組み版をして、必要であれば、PDFにしていましたから。

PDFというものは、印刷イメージをできるだけ忠実に再現をしたもので、比較的、多くの端末での表示がされやすい。というものです。
(昔は、そうではなかったですが…)

もうひとつ書きますや、

  • 日本語の体裁は、フォントで決まります。

ですので、フォントが違えば、日本語の体裁も、違うはずです。

さて、ここまで書くと、どうも、日本語を読んでいるのではなくて、文字コードを読んでいると思えてきますね。

この読み物を読まれたかたは、少し考えてみると、このことがすぐに分かると思います。

読んでいる。としても同じなので、そうと書いてもいますが、意味合いが違う。ということです。

SEO、つまり、《検索エンジンに対してページを最適化する。》というものは、単に、

  • キーワードスタッキングや、文章量や、リンク周りを含んだ、サイトの構成ではない。

ということで、どちらかと言えば、これらは、コンテンツ、つまり、内容に対しての、具体案のひとつです。

単に、訪問者に訴求をするような構成にしなさい。分かりやすく、整理された。などといった、抽象的なことを、具体的に書いている。ということです。
多くのかたが、きちんとしたSEO業者さんが無料で公開をされていることに感謝をするところは、こういった部分だと思います。
本当に、寝る間も惜しんで調べているかたもおられます。

さて、話を戻して、勿論、先のリストをSEOと言うんですが、先生として、お金を頂くのであれば、検索エンジンの内部を弄ることは違反ですも、そうとせず、外部的に、本来であれば、知っておくべきことは、沢山あるわけです。

さて、ここからは、何をオリジナルとしているのか?を書いていこうと思いますが、もし、googleのクローラーが、

  • 単語
  • 単語の出現頻度と、重みと出現間隔
  • 国文法の《語》《部》《詞》

などを観ていたとして、例えそれが文字コードであったとしても、この中に、オリジナルとの判断を下せるものはなく、何らかの判断をしているとすれば、これで判断ができるのは、

類似性/非類似性

についてであり、要するに、コピーかそうではないか。です。

今の段階では、機械と人間の違いについては、分析の速さや使用データの膨大さと思考や勘所や感情とも言われていますが、ぶっちゃければ、

無機的


有機的

かです。

次に、

  • コンテンツが新しいことが重要。
  • コンテンツが古いことが重要。

と言われていて、一見すると矛盾をしているように思えますが、これは、

  • googleにとって、同じものがないことと、訪問をするかたの利便性や、情報の新鮮さなどの観点

から、コンテンツが新しいことが良くて、

  • サイトやブログに付けている、ドメインの年数

から、古いことが良いんです。

つまり、それなりの場数を踏んできたサイトやブログが、評価をされるわけです。
勿論、始まってすぐに評価をされることも、往々にしてあるとは思います。

文字数の多少は、本来であれば、関係はありませんが、SEO界隈のかたは、読み応えがある文章量という意味ではなくて、キーワードのスタッキングのしやすさ。という面で、長文のほうが良い。ということを言っているわけです。

*これとは別に、何故SEOなんてやっているんだろう?と思えるほどに、文章力が高い人が、何人かいます。

長文にするのであれば、読み応えのほうを重視できれば良いことは、言うまでもないことです。

googleは、元々、《長文ではなくても、そのことに対して、ほどよい長さで良い。》と言っているんです。

この辺りの捉えかたの違いを、間違えると、しんどいですね。

なので、日記でも良いわけですも、これに対しても、

有名人でもないかたの日記なんて、誰が読みたいと思うんだ?

とも言われていますが、普通であれば、元々、現実での知り合いがいるはずですし、知らない人にも、観て頂ける可能性があるわけです。何より、そうすると、同じようなものができないことが大きいと思います。

例を挙げるとSEOであったり、アフィリエイトの記事は、同じようなものばかりのことも、多いはずです。
この理由は、検索エンジンの上位に表示がされている、サイトやブログの、構成や文章を、手本にしなさい。と、言われているからで、その為からも、上位に表示がされることを、目論むわけで、そこにあるのは、検索エンジン最適化とアフィリエイトがセットになった読み物であることが、多いはずです。

これを、いけない。と言っているわけではないです。
どちらかと言えば、オリジナリティーが求められるのは、ニュース系のものであるようにも思います。

さて、もし、サイトブログの、何らかのページの順位が芳しくないのであれば、若しくは、それでもいいので、読み物の量産をしているのであれば、

  • トップページからの内部(できれば、別に用意をしたサイトのトップページからの外部)リンク

で、ある程度は解決をします。

これは、サテライトサイトを作る。ということとは、意味合いが違い、そこまで大掛かりなことではありませんが、こうすることによって、サイトやブログに厚みが出て、トップページを、より強くします。

普通であれば、リンクを被ったページが強くなるわけで、その為に、こういった手法を使うかたも多いんですが、

関連のあるテキストなどでのリンク

が作れることと、それによっても、

サイト内の滞在時間が増える可能性がある

ので、トップページが強くなるわけです。

勿論、本当に、素晴らしい読み物であったとしても、競合の多さなどから、順位が芳しくないのであれば、という意味合いでのことからが、多分に含まれてのことです。

但し、重みなどの変遷から、あることに特化をした内容のサイトであるならば、暫くして順位が下がることもありますし、そもそもが、ページの質が低すぎると、サイトそのものの順位にまで、影響を及ぼすことがあります。

さて、アルゴリズムとして定義をされているかどうかは分かりませんも、検索エンジンの上位に表示をする為に、必要なもののひとつが分かりました。

  • 指示代名詞

です。

指すものがリンク先にある。という意味ではなく、同じページにあり、且つ、文章としてみたときに、適当な間隔をもっていることが大事なようです。

この読み物では、機械的なことについて、焦点を当てていますので、そこを書きますや、これは、《人は指示をされたところの確認をする。》という意味ではありません。

*勿論、その意味もなくはないです。

お持ちのサイトブログが、読み物ベースで、検索エンジンの上位に表示がされることを目論むのであれば、上に加えて、読み物の書きかた。というものが、重要になってもきます。

*おかしなバズやおかしなリンクを付けなくても、現実の知り合いや、仕事仲間の何人かで、リンクをすれば良いんだよ。何だったら、こっそりと、勤め先のページの、バレないところに、幾つかのリンクを忍ばせて…というものとは、また別です。

キーワードによっては、こういった、せこい方法でも、充分に上位を狙えますが…

話題が逸れましたが、下が読み物の型です。

序破急

これは、雅楽から出たもので、

  • 能楽
  • 狂言
  • 歌舞伎
  • 落語
  • 連歌
  • 花道
  • 抜刀術

などでので、西洋でも、同じような概念がありますし、文章を構成する型のひとつでもあります。

止 静 拍 動 激 止

です。

つまり、

  • 最初は止まっており、静かに始まり、拍子を付けて、激しくして、止まる。

で、これは、として、次第に、この場合は読み手。を引き込む手法のひとつです。

起承転結

これはそのままです。

三一致

これは、中世ヨーロッパの、オペラを書くときの技法です。
間違った理論ではあるんですが、勉強をしていたこともあり、私はこれをよく使います。

それで、この文章を書いているときに気が付いたんですが、キーワードスタッキングがしやすく、《》《》《》が豊富に扱えて、本来の使いかたではないですが、換喩法というものを使うことが得意であることからも、関連用語が出やすいことは、あると思います。

もうひとつの型

20年以上も前から、流行っている、ひとつの型ですが、これには、嘘も多分に含まれていますも、一番やりやすく、現行では普遍で、キーワードのスタッキングをしやすい型ではありますし、一般的に読みやすいとされている型ですので、検索エンジン中の上位に表示をすることに対して、一役買う。ということはあると思います。

但し、多くのサイトで、似たようなものになる可能性がある。ということです。

*嘘も多分に含まれる。と書いたのは、違う書きかたをしている読み物の、キーワードやページの順位が、じわじわとでも、上がっているからで、SEO界隈にいる殆どのかたは、この型については、それとは気が付かずに、簡潔さを言っているのではなく、キーワードのスタッキングについてを言っていることからを鑑みての書です。

簡潔であることは合っていますが、ことSEO界隈で重要視をされているのは、キーワードのスタッキングがしやすい。ということで、これが、隠れた本当の意味です。

さて、テーマを絞ることが大事である。とは言われていますが、それをすると、関連用語が出てき辛くもなります。
このことからも、とどのつまりは、逆説的にキーワードスタッキングをやりやすい型である。ということです。

下に書いてある程度のスタッキングであれば、googleからも怒られることはないはずです。

  • テーマを絞る。
    タイトルであったり、見出しであったり、ここに、キーワードの記述をします。
  • 結論から始める。
    ここにも、キーワードの記述をします。
  • 訪問者の興味を掻き立てるような文言を入れる。
    ここにも、キーワードの記述をします。
  • テーマについての解説。
    ここにも、幾つかのキーワードの記述をします。
  • もう一度テーマと結論を書く。
    ここにも、幾つかのキーワードの記述をします。
  • 読み手へのメッセージ(訴求)。
    ここにも、キーワードの記述をします。

ということで、こういった、文章の構成方法は、それなりに大切である。ということです。

この読み物の終わりに、先に記した文章を、ひとつ例に挙げてみます。

下を考えて下さい。

テーマを絞ることが大事である。とは言われていますが、それをすると、関連用語が出てこなくなります。

この文章を、

テーマを絞ることが大事である。とは言われていますが、テーマを絞ると、関連用語が出てこなくなります。

などとすると、悪くはないと思いますし、スタッキングにもなりますが、文字コードとして、出したい並びが、出なくなるわけです。

それから、

  • ページが必ず一位

という方法も、あるそうで、

  • 必ず上位になる。という方法もあるそうです。

但し、これを狙って探すことは、時間の無駄でしょうし、読んで頂く人のことで良いわけです。

独自のコンテンツが重要となってくるのは、別記をする、ニュース検索のことが大きく関係をしているように思います。

ma1d3n
Facebook yositaka akase

コメント

このブログの人気の投稿

【沖縄県で暴徒化をした若者が警察署ですかに被害を出したことについて】

【沖縄県で暴徒化をした若者が警察署ですかに被害を出したことについて】 この投稿は、2022年は1月の31日にメッセンジャーに記していた雑記を、ブログ用に纏めたものです。 丁度 警察 のことにつきましてを記していますし、他のこと、例えばですも、 新潟県 の 佐渡金山 の話で、昨年末から今年の初めにかけましての投稿のあたりのようなことにもなっていますね。 色々な ニュース の報ですも、自身もTBSのニュースの報が少しあやふやですが、 TBS の朝の ニュース で、 沖縄県で300人ほどの若者が集まり、暴徒化をしました 。との報でしたも、どうやら、 高校生 でしたかが バイク の運転をしていまして、 警察 が 職務質問 を行ないまし為にそれな バイク と接触をし、 警官 が?怪我をされましとのことと、 高校生 が 眼球破裂 とのことです。 高校生 は 警官 に 警棒 で殴られたとのことを言っていましなそうでありな報です。 また、件の 高校生 はですも、どうやら、 暴徒 とは関係がありませんでしたのようであり、 高校生 の友人も観に来られましては、件の 高校生 が自分で 救急車 を呼んでくれとしていたそうでありなことであったようです。 件の 警官 は、その 高校生 が関係はなかったことは認めていましとのことであり、双方に話を聞きましとのことです。 当初は、 SNS で何でしたかの拡散をされましたのことからに他が知り、若者が集まり。と言いまし体の報でありましたが、上の拡散で集まりかとも思いましたが、そうではないのかもしれず、迷惑行為と言いましょうか、それ以上ですが、そのようなニュアンスもありな報のようでもありましたが、幾分なりと 警官 よりではなくなってきてもいましなようです。 その後、別のニュースでは、 4日ほど前に起こりましたのこと と致しまして、 警官 が バイク で走っていましな少年の静止をしたとのことであり、でありませば、上の ニュース の報が何やらとおかしくに思う部分もありです。 【まるで漫画のよう】 やらからもの繋がりと言いましょうか、昨年末の地元の話やらにも丁度のことあり、まあ色々とあるということでしょう。有り難うとは言えませんし、擁護は致しませんが、なんか、うん。 Su

【売れ行き】

【売れ行き】 この投稿は、2022年は4月の2日にメッセンジャーに記していた雑記を、ブログ用に纏めたものです。 昨年でしょうか今年のこれまででしょうかの書籍の売れ行きにつきましてのトップ3が興味深く、そのようなことをテレビで放送をせずとはその 作家 さんやら フォロワー さんの言ですも、ひとつと致しまして、テレビで報じると凄いと言いましことと、このようなかたも同様な言としてありますが、反テレビなどの中にも色々なかたがいましとのことですし。 *丁度テレビ番組でそのような放送がありました。 昨年や今年ではなしに、2018年とのことです。カルト本としましたは失礼をしました。 ツイート を読みそのまま記してしまいました。別の話しとの混同もあり。 *まぁある方と同名の名前が出てこちらをどうとのこともありな感じのかたもいますが、その 宗教 とと言いますよりは別の関係でしょうけれど、中の話しとしましたことなそ、もう少し後で記します。 元々、上とは違いましょうも、ある ジャーナリスト さんでしょうかが、 ジャーナリスト でしょうか コメンテーター でしょうかのランキングで30番以内に入っていましなことでありましようで、同人さんがそれのツイートを致しますと、そちら系のかたが同ランキングの上位を占めましようになり、30番以内に入りましかたもトップ5に入りましようになり。 この機関が、 単にサイトで行なっていまあいなもの そちら系のところ 厳正に行なわれまし統計 で違いますが、いっぽうでは、 維新 のかたにも件のかたは ジャーナリスト と言いましよりは(いかがわしい部類の示唆ありかどうかは分かりませんも) 商売人 であり。ともあり、別のかたによりますと、元々が 旅行代理店 でしょうかに勤められましての独立をされましてのかたでありましな旨ありなことで、 旅行 系のことが事実か否かは分かりませんし、揶揄も入りますでしょうし、それ自体が良い悪いはありませんとは思いますが、どうも凄いかたのような感じになりが分からず。 ただ、まぁ 政治 的なことでの、 維新 への講師と致しましての顔もあり、天下りといいましこととは違うでしょうけれども 自民党 と言いましょうか 安倍 晋三 さんともそうでその後やその時分であ

【ロシアとウクライナのこと】

【ロシアとウクライナのこと】 この投稿は、2022年は2月の24日にメッセンジャーに記していた雑記を、ブログ用に纏めたものです。 これな投稿は最後から記します。《次ですも》と言いましものがひとまとまりです。 それから、 Twitterのモーメントへのリンク を貼っておきます。 *この問題につきまして、他の投稿が間に入りますもはご容赦を頂きたくに思いますが、ここからそれまでの雑記に遡って整理をしようと思います。 まずですも、 百田 尚樹 さん辺りがまた騒ぎ出しました。 ブログに投稿をしましな為に一応纏めておきますが、情勢が混沌としていましな時分には静かであり、そうでなければ日本人へテメェらコラッ!など。 今回は ウクライナ のそのかたにどうのではなしに、 百田 尚樹 さん他に、以前からですも 戦争 を煽り逃げましは辞めて頂きたい。と言いまし話しです。 特に最近は目覚めよ!などと凄いですしね。 次ですも、 プーチン さんの話しですがでは、 ウクライナ の 占領 は含まれておらず、同国の 非軍事化 が目的でありなそうでありですが、同国のかたには武器を置くようにとのことを同人さんが物申していましとのことが TBS の ニュース番組 である ひるおび! で報じられています。 これが事実かどうか、また、真かどうかです。 同 ニュース番組 の放送では、 プーチン さんのことで、 ウクライナ の話しの精神的な部分やら、そちらが母で ロシア のほうが子供でありましと言いまし話しやら、同人さんが幼い頃に読まれましたの 小説 から、 KGB での仕事をしたいと思うようになり、実際にそのようにされていまして、 ドイツ語 もできまし話しやらもありでした。 その後に、同 ニュース番組 でも、 ウクライナ の各地で 銃撃戦 が起こっていましとのことやら、 キエフ の 空港 でも 爆発音 がありやらとの報であり、今後同国から他の ヨーロッパ のほうに人の流出が起こりましたの場合に、受け入れの態勢ができていましか。につきましてなどと言いまし放送でした。 Twitter でも、 ロシア 側が東部での 特殊作戦 の許可をしましとのことが報じられていますが、 バイデン さんの言では、これは計画的なことであり、大量に人が亡くなりましたの場