スキップしてメイン コンテンツに移動

【オリジナルコンテンツと検索エンジンへの上位表示について…機械的な側面】

【オリジナルコンテンツと検索エンジンへの上位表示について…機械的な側面】

この投稿は、日本時間の2017年から2018年の現在、こと6月の8日と同13日に、メッセンジャーに宛てた雑記を、ブログ用に直したもので、それに、googleのガイドラインや、調べたり経験をしたことを加えたものです。

この読み物では、オリジナルコンテンツというものと、google検索エンジンへの上位表示というものを、機械的な側面から考えています。

さて、最近、といっても、何年も前からですも、SEO、つまり、検索エンジン最適化界隈のかたは、よく、

独自性のあるコンテンツを〜

などと謳っていますが、少し考えて下さい。

  • googleは、クローラーというものが、WEBの巡回(という表現です)をしているわけです。

googleは、クローラーが持ち帰ったページの情報を、《何百もの要因でふるいにかけて、検索エンジンに表示がされる順位を決定しているようです。》

例えば、あるブログなり、サイトなりがあったとして、それが日本語且つhtmlで書かれていた場合のことを考えてみると、googleクローラーがみているものの幾つかは、

  • 単語
  • 単語の出現頻度と、重み出現間隔
  • 国文法の《》《》《
    (どれほどかは分かりませんが、みているはずです。)

というようなものがあります。

ここまでで、少し書かせて頂きますや、《検索エンジン最適化》という言葉は、

  • 検索エンジンを最適化する。

という意味合いではなくて、

  • 検索エンジンに対して、ページなどを最適化する

という意味で、言葉の綾と言うか、そういった界隈のかた以外にも、大体にして分かることから、大方の人は、故意に縮めているわけです。

また、ここまでで言うところの、googleのクローラーが観ている。とした表現は、お気付きかもしれませんも、あくまで人間側からした観えかたで、実際には、下に記すように、そういったものではありませんが、取り敢えずの説明のしやすさを加味をしての記述です。

少し専門的な話になりますが、日本語というか、漢字平仮名というものは、《2バイト文字》と呼ばれるもので、ローマ字などとは、文字を表現する記憶の格納領域に多少があり、これを、

  • 文字コード

というものを使って、表わしています。

色にしても、色を表わすコードがあります。

ですので、例えば、端末の画面に表示がされているそのままを、コンピューターが理解をしているわけではなく、最終的には、2進数となるわけですが、とどのつまりは、

  • コンピューターが、意味が理解をできていなくても、訪問者に、観せることはできる

ということで、これは、

  • 自考自立型ではないですから、日本語の意味が理解をできていなくても、日本語のフォントを、端末に表示をすることができる。

という意味です。

それで、考えることは、次です。

googleのクローラーは、

  • 日本語を観ていると思いますか?
  • 文字コードを観ていると思いますか?

最近、といっても、何年も前からですが、規格が良くなって、文字化けをすることは、滅多にお目にかからなくなったんですが、それでも、偶に、そういったことがあるわけで、その時に、上記のようなことを、ふと思ったわけです。

そうです。

文字化けをしていても、コンピューターの内部的には、エラーがなく、文字化けをしたままで、表示をするわけです。

*本来であれば、次の文字や、となる場所にまで、記憶領域が溢れていますので、オーバーフローをしているわけです。
内部的には、全く別の記憶領域に溢れていることになります。

つまり、自然言語での検索であろうと、人間が言うところの、日本語を観ているわけではないんです。

それから、googleニュースについてのことを考えてみると、PDFという規格で、インターネットに公開をしていると、googleのクローラーは、そのファイルの中にある文字が読めないんです。

*少し前のことですから、現在については、詳細は分かりませんが、ガイドラインだったかを読むと、《PDFは読めない》旨しっかりと書いてあります。

このことから、googleのクローラーは、せいぜい、これはPDFという規格のファイルである。ということが分かって、端末に、その中で使われている言語での表示はできる。くらいであると思います。
こうと思ったのは、別記をする、もっと順位が高くてもいいはずの、サイトの順位が、PDFで公開をしている為からか、低いからです。

*本来であれば、おかしなリンクを付けずとも順位が高いはずの、官庁などのサイトが低いのであれば、これも、原因のひとつに挙げられると思います。

*ここでは、PDFが嫌と言っているわけではなくて、googleの規格に沿うほうが、上位に表示がされやすい。としているだけです。

事実、昔は私も、texを使って組み版をして、必要であれば、PDFにしていましたから。

PDFというものは、印刷イメージをできるだけ忠実に再現をしたもので、比較的、多くの端末での表示がされやすい。というものです。
(昔は、そうではなかったですが…)

もうひとつ書きますや、

  • 日本語の体裁は、フォントで決まります。

ですので、フォントが違えば、日本語の体裁も、違うはずです。

さて、ここまで書くと、どうも、日本語を読んでいるのではなくて、文字コードを読んでいると思えてきますね。

この読み物を読まれたかたは、少し考えてみると、このことがすぐに分かると思います。

読んでいる。としても同じなので、そうと書いてもいますが、意味合いが違う。ということです。

SEO、つまり、《検索エンジンに対してページを最適化する。》というものは、単に、

  • キーワードスタッキングや、文章量や、リンク周りを含んだ、サイトの構成ではない。

ということで、どちらかと言えば、これらは、コンテンツ、つまり、内容に対しての、具体案のひとつです。

単に、訪問者に訴求をするような構成にしなさい。分かりやすく、整理された。などといった、抽象的なことを、具体的に書いている。ということです。
多くのかたが、きちんとしたSEO業者さんが無料で公開をされていることに感謝をするところは、こういった部分だと思います。
本当に、寝る間も惜しんで調べているかたもおられます。

さて、話を戻して、勿論、先のリストをSEOと言うんですが、先生として、お金を頂くのであれば、検索エンジンの内部を弄ることは違反ですも、そうとせず、外部的に、本来であれば、知っておくべきことは、沢山あるわけです。

さて、ここからは、何をオリジナルとしているのか?を書いていこうと思いますが、もし、googleのクローラーが、

  • 単語
  • 単語の出現頻度と、重みと出現間隔
  • 国文法の《語》《部》《詞》

などを観ていたとして、例えそれが文字コードであったとしても、この中に、オリジナルとの判断を下せるものはなく、何らかの判断をしているとすれば、これで判断ができるのは、

類似性/非類似性

についてであり、要するに、コピーかそうではないか。です。

今の段階では、機械と人間の違いについては、分析の速さや使用データの膨大さと思考や勘所や感情とも言われていますが、ぶっちゃければ、

無機的


有機的

かです。

次に、

  • コンテンツが新しいことが重要。
  • コンテンツが古いことが重要。

と言われていて、一見すると矛盾をしているように思えますが、これは、

  • googleにとって、同じものがないことと、訪問をするかたの利便性や、情報の新鮮さなどの観点

から、コンテンツが新しいことが良くて、

  • サイトやブログに付けている、ドメインの年数

から、古いことが良いんです。

つまり、それなりの場数を踏んできたサイトやブログが、評価をされるわけです。
勿論、始まってすぐに評価をされることも、往々にしてあるとは思います。

文字数の多少は、本来であれば、関係はありませんが、SEO界隈のかたは、読み応えがある文章量という意味ではなくて、キーワードのスタッキングのしやすさ。という面で、長文のほうが良い。ということを言っているわけです。

*これとは別に、何故SEOなんてやっているんだろう?と思えるほどに、文章力が高い人が、何人かいます。

長文にするのであれば、読み応えのほうを重視できれば良いことは、言うまでもないことです。

googleは、元々、《長文ではなくても、そのことに対して、ほどよい長さで良い。》と言っているんです。

この辺りの捉えかたの違いを、間違えると、しんどいですね。

なので、日記でも良いわけですも、これに対しても、

有名人でもないかたの日記なんて、誰が読みたいと思うんだ?

とも言われていますが、普通であれば、元々、現実での知り合いがいるはずですし、知らない人にも、観て頂ける可能性があるわけです。何より、そうすると、同じようなものができないことが大きいと思います。

例を挙げるとSEOであったり、アフィリエイトの記事は、同じようなものばかりのことも、多いはずです。
この理由は、検索エンジンの上位に表示がされている、サイトやブログの、構成や文章を、手本にしなさい。と、言われているからで、その為からも、上位に表示がされることを、目論むわけで、そこにあるのは、検索エンジン最適化とアフィリエイトがセットになった読み物であることが、多いはずです。

これを、いけない。と言っているわけではないです。
どちらかと言えば、オリジナリティーが求められるのは、ニュース系のものであるようにも思います。

さて、もし、サイトブログの、何らかのページの順位が芳しくないのであれば、若しくは、それでもいいので、読み物の量産をしているのであれば、

  • トップページからの内部(できれば、別に用意をしたサイトのトップページからの外部)リンク

で、ある程度は解決をします。

これは、サテライトサイトを作る。ということとは、意味合いが違い、そこまで大掛かりなことではありませんが、こうすることによって、サイトやブログに厚みが出て、トップページを、より強くします。

普通であれば、リンクを被ったページが強くなるわけで、その為に、こういった手法を使うかたも多いんですが、

関連のあるテキストなどでのリンク

が作れることと、それによっても、

サイト内の滞在時間が増える可能性がある

ので、トップページが強くなるわけです。

勿論、本当に、素晴らしい読み物であったとしても、競合の多さなどから、順位が芳しくないのであれば、という意味合いでのことからが、多分に含まれてのことです。

但し、重みなどの変遷から、あることに特化をした内容のサイトであるならば、暫くして順位が下がることもありますし、そもそもが、ページの質が低すぎると、サイトそのものの順位にまで、影響を及ぼすことがあります。

さて、アルゴリズムとして定義をされているかどうかは分かりませんも、検索エンジンの上位に表示をする為に、必要なもののひとつが分かりました。

  • 指示代名詞

です。

指すものがリンク先にある。という意味ではなく、同じページにあり、且つ、文章としてみたときに、適当な間隔をもっていることが大事なようです。

この読み物では、機械的なことについて、焦点を当てていますので、そこを書きますや、これは、《人は指示をされたところの確認をする。》という意味ではありません。

*勿論、その意味もなくはないです。

お持ちのサイトブログが、読み物ベースで、検索エンジンの上位に表示がされることを目論むのであれば、上に加えて、読み物の書きかた。というものが、重要になってもきます。

*おかしなバズやおかしなリンクを付けなくても、現実の知り合いや、仕事仲間の何人かで、リンクをすれば良いんだよ。何だったら、こっそりと、勤め先のページの、バレないところに、幾つかのリンクを忍ばせて…というものとは、また別です。

キーワードによっては、こういった、せこい方法でも、充分に上位を狙えますが…

話題が逸れましたが、下が読み物の型です。

序破急

これは、雅楽から出たもので、

  • 能楽
  • 狂言
  • 歌舞伎
  • 落語
  • 連歌
  • 花道
  • 抜刀術

などでので、西洋でも、同じような概念がありますし、文章を構成する型のひとつでもあります。

止 静 拍 動 激 止

です。

つまり、

  • 最初は止まっており、静かに始まり、拍子を付けて、激しくして、止まる。

で、これは、として、次第に、この場合は読み手。を引き込む手法のひとつです。

起承転結

これはそのままです。

三一致

これは、中世ヨーロッパの、オペラを書くときの技法です。
間違った理論ではあるんですが、勉強をしていたこともあり、私はこれをよく使います。

それで、この文章を書いているときに気が付いたんですが、キーワードスタッキングがしやすく、《》《》《》が豊富に扱えて、本来の使いかたではないですが、換喩法というものを使うことが得意であることからも、関連用語が出やすいことは、あると思います。

もうひとつの型

20年以上も前から、流行っている、ひとつの型ですが、これには、嘘も多分に含まれていますも、一番やりやすく、現行では普遍で、キーワードのスタッキングをしやすい型ではありますし、一般的に読みやすいとされている型ですので、検索エンジン中の上位に表示をすることに対して、一役買う。ということはあると思います。

但し、多くのサイトで、似たようなものになる可能性がある。ということです。

*嘘も多分に含まれる。と書いたのは、違う書きかたをしている読み物の、キーワードやページの順位が、じわじわとでも、上がっているからで、SEO界隈にいる殆どのかたは、この型については、それとは気が付かずに、簡潔さを言っているのではなく、キーワードのスタッキングについてを言っていることからを鑑みての書です。

簡潔であることは合っていますが、ことSEO界隈で重要視をされているのは、キーワードのスタッキングがしやすい。ということで、これが、隠れた本当の意味です。

さて、テーマを絞ることが大事である。とは言われていますが、それをすると、関連用語が出てき辛くもなります。
このことからも、とどのつまりは、逆説的にキーワードスタッキングをやりやすい型である。ということです。

下に書いてある程度のスタッキングであれば、googleからも怒られることはないはずです。

  • テーマを絞る。
    タイトルであったり、見出しであったり、ここに、キーワードの記述をします。
  • 結論から始める。
    ここにも、キーワードの記述をします。
  • 訪問者の興味を掻き立てるような文言を入れる。
    ここにも、キーワードの記述をします。
  • テーマについての解説。
    ここにも、幾つかのキーワードの記述をします。
  • もう一度テーマと結論を書く。
    ここにも、幾つかのキーワードの記述をします。
  • 読み手へのメッセージ(訴求)。
    ここにも、キーワードの記述をします。

ということで、こういった、文章の構成方法は、それなりに大切である。ということです。

この読み物の終わりに、先に記した文章を、ひとつ例に挙げてみます。

下を考えて下さい。

テーマを絞ることが大事である。とは言われていますが、それをすると、関連用語が出てこなくなります。

この文章を、

テーマを絞ることが大事である。とは言われていますが、テーマを絞ると、関連用語が出てこなくなります。

などとすると、悪くはないと思いますし、スタッキングにもなりますが、文字コードとして、出したい並びが、出なくなるわけです。

それから、

  • ページが必ず一位

という方法も、あるそうで、

  • 必ず上位になる。という方法もあるそうです。

但し、これを狙って探すことは、時間の無駄でしょうし、読んで頂く人のことで良いわけです。

独自のコンテンツが重要となってくるのは、別記をする、ニュース検索のことが大きく関係をしているように思います。

ma1d3n
Facebook yositaka akase

コメント

このブログの人気の投稿

【黒瀬 深_おかしなことをしている日本人】

【黒瀬 深_おかしなことをしている日本人】 この投稿は、2021年は6月の16日にメッセンジャーに記していた雑記を、ブログ用に纏めたものです。 米山 隆一 さんが 黒瀬 深さんというかたのTwitter の 発信者情報の開示 をされたことにつきましてですも、そのようにされましたは昨年は2020年のことですが、何故か今年は2021年は同時期になっていますのことにつきまして、おそらくのところ、単に、年数やら字を間違えただけのことでしょうけれど、若しくは事実か否かは分かりませんも、 フランス が手を貸しているとありますの、 中国 の 原子力発電 の 放射能漏れ のことが報じられていますのことと致しまして、 中国 が否定をされていますのこと。 別の国の原子力発電の事故を、起こるか否かを確かめましたの可能性 。 但し、 中国 とありますのことが起こりましたの後ですので、このことではありません。 昨年の話ですに、 米山 隆一 さんは今、 発信者情報の開示 をしましたとしています。 黒瀬 深 さんというかたも、消したとありますが、 ツイート を観ますに、本来は昨年のことでありますを知ってでありますに、まるで今、 発信者情報の開示 が行なわれたような体であり、他国のかたの ツイート のよう。 リストの二番目は、他国のかたでありませば、別の理由を伝えて書かせている。ということでしょうけれど、おそらくは 日本人 で、そのように観せる為でしょうけれど、これまでの 黒瀬 深 アカウント のかたの記しかたではないですね。 別記を致しますも、 メッセンジャー に記しましたの、パッとみただけでどうと言いますは、このようなレベルの意味ではありませんが、そのようにもされているということでしょうし、これは 匿名アカウントのA、Bの話で、同一人物と違う人物との話 のことで解のひとつになると思います。 米山 隆一 さんは、昨年言ったことを今年のことにしているということであり、知っていますに故意にそのようにしているということであり、知ってか知らずか、 黒瀬 深 アカウントと共謀をしている部分がある可能性があり、ですので、お騒がせ商法か。という話でありますが、記しておきませば、それはできずでしょう。 要するにで

【一般人に対してのこと】

【一般人に対してのこと】 この投稿は、2020年は10月の19日にメッセンジャーに記していた雑記を、ブログ用に纏めたものです。 *2021年は7月の19日に直しを入れましたが、目次と見出しとTwitterとPest Plurkへのリンク、つまり構造を変えたということであり、意味は変わっていません。 これな投稿の説明を、 Twitter上で行なっています 。 Twitterの使用をされていないかたは Paste Plurk で記しています。 以下は目次です。 黒瀬 深さんというかたとの関連が密になって来た時分について Dr.ナイフさんというかたとのことの済みと過去の技術評論社との関連とこのふたつのこと /*----- ☆ 1 黒瀬深さんというかたとの関連が密になって来た時分について -----*/ しかし面白いものであり、これな頃のことですも、まるで計ったかのように 黒瀬 深 さんというかたとの 関連 ができましたね。もっと以前から 米山 隆一 さんのほうからとのことはありましたが、 黒瀬 深 さんというかたとの問題と、似た問題と、こちらごと。こちらごとはその都度に記しますけれど、面白い 関連 です。 米山 隆一 さんは 悪意のある作為 というものも幾つもありますけれど、のようにに記していましたらば、やはり色々なことを知っていますのかたもあられますのか、年が変わり、2021年は7月のはじめになり、同人さんのこと含みまして、そのようなかたによりますの、デマやら揶揄であろうとやら、捏造やら、そのようなおかしなことに一般人が巻き込まれないようにしなければならない。と言いますのようなコメントが、同人さんの Twitter に付いていました。 /*----- ☆ 2 Dr.ナイフさんというかたとのことの済みと過去の技術評論社との関連とこのふたつのこと -----*/ 年が変わり、7月になってから気が付きましたのことですも、 Dr.ナイフ さんといわれるかたですがは、 論座 という 朝日のインターネット上の雑誌 の執筆をやめられていますのようであり、事実かどうかは分かりませんも、一部にはレベルの問題が言われていましたり、契約期間の満了

【米山 隆一さんは両刀使いかということについてとある音楽のジャンルのことについて】

【米山 隆一さんは両刀使いかということについてとある音楽のジャンルのことについて】 この投稿は、2020年は11月の26日にメッセンジャーに記していた雑記を、ブログ用に纏めたものです。 これな投稿は nguyenkieuanh のほうに記しても良いようなものであり、 【地元にバイカーが流れてきました】 という投稿に記しましたのCMでも、それ用の音楽のようにされていましたのことからも、余計にそのように思う次第のことですも、米山隆一というカテゴリーがありますので、そちらに投稿をすることと致しました。 米山 隆一 さんは ホモセクシュアル でもあるのかもしれませんね。 男性が男性を好きということと、 性同一性障害 というものは別であり、黄門グリグリとか、竿(男性の根のこと)がどうとか、そのようなものはブロックをしないということは、やはり...いえ、冗談も好きなんですね。 そう言えばですも、昔のことですが、 HM/HR というジャンルの 歌手 が、 ゲイバー に行き、 レザージャケットを着た男のかた同士が踊っている のを観て、これだ!と思い、以降はトゲトゲの レザージャケット と レザーパンツ といういでたちでステージに立つようになり、それを観た後発のかたが、格好の良さから、意味も知らずに皆真似をしたという、逸話とも迷信ともとれないお話があったことを思いだしました。 ひどい... この頃までを少し観た感じでありますと、 米山 隆一 さんも独裁者的であるわけですが、このような冗談も、ずっとでありますと、それはそれで問題でしょうけれど、下ネタという意味ではなくとも、たまの冗談がなければ、大変なことになりますしね。 Subscribe to nguyenkieuanh Subscribe to ynimk ma1d3n Facebook yositaka akase ma1d3n Kindle yositaka akase