2016年9月16日金曜日

ペンギン小ネタ

「ペンギンの日取り決まったの?」
「実施されたの?」
って質問をいくつかいただいたので。

元になってるっぽいのが、毎度おなじみGaryさんのこのツイート。
「Any date for Penguin?」
「Yes.」

…まあ
「ペンギンの実施日程決まった?」
「はい」
と解釈できなくもない。

でも、実際の意味はもっと言葉遊びっぽいものじゃないかと。こんな感じの。
「ペンギンが実施される日ってあるの?」
「あるよ!」

どっちの解釈が正しいかはGaryさんだけしか知らないでしょうが、おそらく後者じゃないかな?
話の流れを追っててもそうだし、何よりこのツイートにGaryさん自身がいいね押してますし。

「Garyは”スケジュールが決まった”などとは一言も言ってない。単に”実施する日がある”と言ってるだけだ。いつかは実施するだろうし、その日には○月×日といった日付はあるはずだよね:)」

むーさんの発言とか見てると進展はしているようですが、あまり気にしないのが一番かと。










2016年8月15日月曜日

キーワードプランナーの仕様変更 ※画像多いので注意

広告主よりもSEOやらウェブマーケの人の需要のほうが多いんじゃ…
というぐらいに、いろんな人がいろんな使い方をしてるキーワードプランナー様。
たまに「無課金には使わせてやんねー!」というメッセージを間違って表示したりもする、ちょっとお茶目なツールです。

最近アップデートでいろいろ仕様が変わったのでメモ。

① 検索ボリュームがとても大雑把になることがある。
普通だと検索ボリュームは有効数字3桁で返してくれますよね。こんな感じ。

先週末から検索ボリュームが「1万―10万」みたいな大雑把な数値しか出ない、という例がちらほらあり、そしてこれが仕様です、との公式発表がありました。
発表内容は以下の通り。

① 大半の広告主は、今まで通りの検索ボリュームを取得可能だよ。
② 月次運用額の少ないアカウントだと、「1万―10万」みたいな大雑把な数しか取れないことがあるよ。
③ 月次運用額が少ないアカウントだと、クエリの数が一定数超えると、そのあとは大雑把な数しか取れなくなることがあるよ。特にAPI使ってる場合は注意。
⓸ 「トラフィックの予測」データには影響ないよ。

「無課金には使わせてやんねー!」は伊達ではなかった orz
…いえ無課金でも使えないわけではないのですが、「1万―10万」とかの粒度ではねえ…

現時点では②・③ともに100%適用されているわけではない様子。
私の無課金アカウントでも普通に検索ボリューム取れているので。
ただ、今後いつ取れなくなってもおかしくないので対応は早めに考えておかないと。

あとSearch Engine Roundtable記事のタイトルが秀逸。
Google Keyword Planner Removes Valuable Data For Potential Advertisers


② 表記ゆれキーワードの検索数を合算することがある。しないこともある。
これは6月末くらいから。
例えば「差し引き」「差引」「差引き」の場合。

「差し引き」と…

「差引」は全く同じ検索数を表示するように。
以前はそれぞれ完全一致のデータを出してくれてたのですが。


厄介なのは、全部の表記ゆれが統合されてるとは限らない点。
「差引き」だと別のデータが出る。
さらに、これが「差引き」完全一致だけのデータなのか、ほかの表記ゆれ含むデータなのかはGoogle神のみぞ知る。


英語だと表記ゆれは単数形・複数形・略語あたりで見当つけやすいのですが、日本語だと送り仮名の有無や漢字の有無でパターンがやたら多いのが厄介です。

2016年7月28日木曜日

HTTPSに移行するときのコツ

これの抄訳。
HTTPSに移行するときのコツです。


ちょっとだけ追記(07/30)
Q7のTTLがmax-ageに記載変更されてたので反映。
Google先生ったら几帳面
=========================


■移行テストについて
Q1:
HTTPSに移行する場合、サイト全体を一度に移行したほうがいい?それとも少しずつのほうがいい?
A
まずは一部でテストして、検索流入やインデックスへの影響を見たほうがいい。
また、テストでうまくいったからといって、いきなり対象範囲を広げすぎると問題が発生することもあります。
計画は綿密に。

Q2:
テスト期間はどのくらいがいいかな?
A
数週間くらい。
クロールして、インデックスして、トラフィックへの影響を確認して…という流れなので、そのくらいの時間が必要。

Q3:
テスト中はHTTPS版がインデックスされるのを避けたい(HTTP版をインデックスしてほしい)という場合、リダイレクトとカノニカルどちらで対応したほうがいい?
A
カノニカル推奨
リダイレクトしてしまうと、そもそもテストにならない。

XMLサイトマップについて
Q4:
robots.txt内で、HTTP版のURLを掲載したXMLサイトマップのURLを記載している。
HTTPS版のXMLサイトマップも、robots.txt内に記載しておいたほうがいい?
A
まず、HTTP版のサイトとHTTPS版のサイトそれぞに、固有のrobots.txtを置くこと。
その上で、HTTProbots.txtにはHTTPXMLサイトマップを、HTTPSrobots.txtにはHTTPSXMLサイトマップを記載する。
また、一つのURLが複数のXMLサイトマップに掲載されないように注意しよう。

Q5:
移行テストする場合、テスト用HTTPSページのURLはどのXMLサイトマップに掲載するといい?
A
テスト用ページだけを掲載した、専用のXMLサイトマップを作るといい。
インデックス状況が正確に把握できるようになる。

Q6
HTTPS版のrobots.txtについて、上記の点以外で何か注意すべきことはある?
A
ない。

Q7:
一部のページだけをHTTPSに対応させた。
「対応していないページのHTTPS版からHTTP版にリダイレクトしている」
「対応しているページのHTTP版からHTTPS版にリダイレクトしている」
などの場合、サイトマップにはどのURLを記載するべき?
A:
① 「HTTPのXMLサイトマップには、HTTPURL
② 「HTTPSのXMLサイトマップには、HTTPSURL
転送は気にせず、上記2点を守れば大丈夫。

■HSTSについて
Q8:
HSTSヘッダにincludeSubDomainsを設定した場合、影響範囲はどのドメインまで?
A
たとえばwww.example.comの場合はこうなる。

影響する:
www.example.com
foo.www.example.com

影響しない:
example.com (サブドメインではない)
foo.example.com (www.example.com自体のサブドメインではない)

HSTSを設定してしまうとロールバックが難しくなるので、以下の手順を推奨する。

1. HTTPS版を公開するが、HSTSは設定しない。
2. TTL→max-ageを短く設定して、HSTSヘッダの送信を開始する。ユーザーや他クライアントからのトラフィック・広告などの関連要素を測定する。
3. HSTSTTL→max-ageを徐々に伸ばす。

ユーザー・検索エンジンに対して、HSTSによる悪影響がないことが確認できたら、ChromeのHSTS preload listに追加することもできる。

■ニュースメディア用
Q9:
現在、サイト全体で単一のGoogleニュースサイトマップを利用している。
サイトの一部でHTTPS移行テストを行うが、その場合どう対処すべき?
A
GoogleニュースサイトマップにHTTPSページのURLの掲載を開始する場合、以下の手順で。
① Googleニュースチームに「プロトコル変更します」と連絡
② サーチコンソールのHTTPS版プロパティから、HTTPS版ページを掲載したGoogleニュースサイトマップを提出

Q10:
HTTPS対応する場合、Google ニュース パブリッシャー センターで何かするべきことはある?
A:
原則的には何もしなくて大丈夫。
ただしニュースサイトマップを利用する場合はGoogleニュースチームに連絡する。
「サイト内のこのセクションだけHTTPSに代わるけど、他はHTTPのまま」のように、一部セクションしか変更しない点を伝えることもできる。
 



2016年6月28日火曜日

Googleキーワードプランナーの不具合?発生中

今日の心臓に悪かったニュース。今のところは不具合とのことだけれど、今後どうなるのやら。

Googleキーワードプランナー使おうとすると、「無課金アカウントには使わせてあげない!」というメッセージが出て使えないことがあるそうです。日本でも6月16日ごろからちらほら発生しているようで。

正式なメッセージはこちら。
英:
To use Keyword Planner, you need to have at least one active campaign.  If you have an active campaign and are still seeing this message, try reloading Keyword Planner in a few minutes.」

日:
「キーワード プランナーを使用するには、少なくとも 1 つの有効なキャンペーンが必要です。有効なキャンペーンがあるにもかかわらず、このメッセージが表示される場合は、数分後にキーワード プランナーを再読み込みしてください。」

現時点での見解としては「ただのエラーです。今まで通り、アクティブなキャンペーンがなくても使えるから安心してね!」とのことですが…

このページが今でもアクセスできるのが気になります。
一応キャプチャ。

無料開放してくれてる今の状態が太っ腹なのですが、移行する前にはちょっとだけ猶予期間置いてくれると嬉しいなーと。

2016年6月26日日曜日

RankBrain小話

RankBrainのおかげで、Googleさんの芸が細かくなっているのに感心したので少々。
初代スーパーマリオ世代でない人にはややわかりにくいかもしれないけれど、そこはご勘弁を。

SMX advancedでGaryさんがこんなことを言っていたそうな。
「RankBrainのおかげで、”マリオを攻略記事(walkthrough)抜きでクリアできる?”といったクエリに満足な答えが出せる」
このクエリで検索すると、なかなか芸が細かいことをしています。

ここで注意が必要なのが、walkthroughという単語。単純に「攻略記事」だと思っていると、RankBrainさんの良さがわからなくなります。
Walkthroughはこんな感じの、初めから終わりまで手取り足取り教えてくれるタイプの詳細攻略です。初めのクリボーの倒し方から丁寧に教えてくれます。


クリアまでの道のりを全部案内してくれるので便利は便利ですが、これを見てクリアしちゃうというのはちょっと味気ない。
”マリオをwalkthrough抜きでクリアできる?”というクエリには、「クリアはしたいけど、walkthroughに頼るのはちょっと...」という繊細なゲーマー心が見て取れます。

しかし、通常の検索エンジンではそうした機微には対応できません。
こうした例で引き合いに出すのも申し訳ないのですが、Bingさんの場合1位からがっつりWalkthroughをお出ししてます。おそらくこんな流れかと。
 ① 「can i beat Mario Bros without using a walkthrough」から、withoutなどのストップワードを除外
 ② 「beat Mario Bros walkthorough」あたりを有効なクエリとして抽出
 ③ walkthroughが検索結果に出る
RankBrainなしのGoogleさんも、多分似たようなことになっていたのでしょう。

それに対して、RankBrain入りGoogleさんは、「この文章では"without"を除外してはいけない」と判断できます。
そして、検索結果では「Cheat」を紹介するという粋な計らいをしています。
Cheatといっても日本で言うチートコード(改造コード)とは違います。
「ここのノコノコで無限1up」とか「ワープ土管の場所」とかの、攻略のコツを紹介するだけのものです。例えば1位のここ。
これなら、ユーザー自身で攻略方法を考える余地もあります。
「クリアはしたいけど、walkthroughに頼るのはちょっと...」という方にはとてもいい回答でしょう。

以上、Google先生のちょっと粋な計らいでした。


■おまけ
RankBrain関連記事で見かけた、ちょっと切ない話。
=======================
David 'Pablo' Cohn (元Google社員)
「Googleでの最初の2年(2002年~2004年ごろ?)にサーチクオリティに所属していたとき、検索品質改善に機械学習を使えないか試していた。しかしその時点では機械学習よりも、”Amit Shinghal(元検索部門トップ)のアイデアをそのままハードコーディングする”ことが最善の手法だった。」

Jeff Dean(Google シニアフェロー、伝説のプログラマー
「2014年にランキングチームと“(機械学習が)どんな成果をもたらすか試してみるべきだ”ということを何度も話し合った。ニューラルネットを利用してスコアを算出し、使い物になるかどうか試してみよう、と。」

実験の結果は良好で、2015年4月にRankBrainを導入。現在ではすべてのクエリの処理にRankBrainが介入し、その大半では順位への影響をもたらす。
=======================
そして2016年2月にAmit氏は退職し、次の検索部門トップにはAI部門のJG氏が。
Amitさんファンとしては少し切ない。





2016年4月10日日曜日

いんたーねっつのきせき

Yahoo!知恵袋で、なぜか4月4日の夜に株式会社DYM祭りが起きていたという話を目にしました。
確認してみると、たしかに盛り上がってますね。

株式会社DYMと言えばすごい相談役を置いていて150パーセントも成長して新規事業にも意欲的第二のリクルートとまで言われている素晴らしい会社です。
いままで寡聞にして株式会社DYMのことを知らなかったので、上記はすべてYahoo!知恵袋様に学ばせていただきました。


「これって自演なんじゃ…」と疑う声もあるようですが、国内No.1のクライアント社数&対策キーワード数を誇るSEO事業を抱える株式会社DYMともあろうものが、そんな稚拙な風評対策をするはずがありません。

では一体何が起きているのでしょう。
祭り中に投稿された質問の質問者・回答者などを整理し…


リンクグラフにしてみました。



青が質問者、オレンジが回答者。○の大きさは質問・回答数にだいたい比例して、〇を結ぶ線は誰が誰に回答したかを示しています。知恵袋みたいな多人数型フォーラムにしてはなかなか珍しいことがいろいろ起きていますので、ちょっと紹介。

① 質問者

この人この人で、質問の9割以上を投稿されています。
よっぽどDYMに興味があるのでしょうね

お二方は質問の仕方もとても似ていて、「株式会社DYMって○○ですか?」「株式会社DYMの○○ってどうですか?」のように、対策キーワード聞きたいことがとても明確です。こうした投稿の書き方は人によってばらつくことが多いのですが、愛のなせるわざですね。

お二方ほど質問回数が多くはないのですが、この方もいろいろと共通する特徴があります。
今後は3名まとめて三本桜と呼びます。これがとてもきれいだったので。他意はありませんよ?

② 回答者

リンクグラフで比較的大きなオレンジの方々はたいへん熱心な回答者なのですが、以下のような共通する特徴があります。

・三本桜全員の質問に回答する
これだけ質問数があると普通は「どれか一つの質問にしか回答しない人」が結構いるものです。
しかしそこはさすがの三本桜。なぜか常にほぼ同じメンバーが回答してくれます。
三本桜の質問ほぼ全部に回答している猛者も     いらっしゃいます。

ここまでのカバー率だと「DYMで知恵袋内を検索して、丁寧に回答してあげたのかな?」と思ったのですが、そうでもなさそうです。お祭りの真っ最中に三本桜以外の人が質問した唯一の投稿がありますが、残念ながら0レスで沈んでいます。どうしてみんなそろって見逃しちゃったのかな?すごい相談役を置いていて150パーセントも成長して新規事業にも意欲的第二のリクルートとまで言われていることとかを教えてあげればいいのに…

きっと三本桜の方々には、特定の方々を強烈に引き付ける魅力があるのでしょうね。
マーケティングの端くれにかかわるものとして、見習いたいものですね。

・文体がそっくり
いらんところでビックリマーク使うのが皆さん大好き。若々しい。
「普通に雑談みたいな感じらしいです!」
「多分探しています!日本中で足りていないので!」
「エンジニアがいらない会社はこの世にないと思います!」
全部別の人の発言です。!なくてもいいかなーと思ってしまうのはきっと私が年寄りだから。

あと語尾にwwとか?を使うのもお好き。知恵袋の文化なのかな?

・DYM関連の質問だけのためにYahoo!知恵袋参加
プロフィールを見ると、2016年4月初めに知恵袋に参加して三本桜の質問だけに答える、という方がとても多いです。質問者の方も同様の行動パターン。
愛されてますね株式会社DYM!(文体模写)

・DYMにとてもやさしい
お祭りのちょっと前に立ったこのスレッドにも、お祭り以降に三本桜スレッドの常連さんがなだれ込んでいます。4/5以降の投稿4件全部。
冗談で場を和ませようとしているvisionなんちゃらさん以外は、皆さん「世間ももうちょっと寛容になっていいんじゃない」といった優しみ。大人だなあ…

③ 結論

こうしたデータを虚心坦懐に見つめることで、祭りの真実が見えてきます。
言わなくてもお分かりかと思いますが、簡単に整理するとこんなところです。

偶然三本桜がほぼ同時に”Yahoo!”知恵袋でDYMのことを聞いてみようと思い立つ

偶然三本桜がほぼ同時にYahoo!知恵袋を初利用、質問を連投

偶然DYMを愛する回答者たちもYahoo!知恵袋に参加、漏らさず回答


ここだけしょんぼり

一言でまとめると「DYMへの自然な愛が起こした奇跡」ですね。
風評対策と称した虚偽の情報や恣意的な情報操作も多いいんたーねっつですが、まだまだすてたものではありませんね。lol

2016年4月9日土曜日

むーさんのURL転送設定解説

むーさんが301・302とかmeta refreshとかの転送全般を、Googleさんをはじめとした検索エンジンがどう処理するかをわかりやすくまとめてくれました。


○要点:

■転送はあくまでも「正規URLを選ぶヒントの一つ」

他の正規化シグナルとの矛盾は避けましょう。
「301転送してるのにインデックスされるURLがおかしい!」→Canonicalが矛盾してましたとか割とありがちですよね。

■転送方法

  • できれば301・302かJS転送使いましょう。
  • JS転送の場合、URL正規化も忘れずに。L
  • meta refreshは一応使ってもいいけど…くらい。


以下全訳。

=============================

各種転送のガイドライン


いろいろな転送方法がありますが、それぞれの違いを理解しましょう。それぞれの使いどころもわかるし、間違って実装していることを見つけられるようにもなります。Googleは皆さんが間違って実装していても、結構うまく処理するので安心してね :)

転送は基本的に「転送元ページ」から「転送先ページ」に向けて行います。以下では転送元ページをR、転送先ページをSと呼びます。RとSはHTMLページだけじゃなくて、https://example.com/filename.aspみたいな拡張子のページなこともあります。以下の説明は、そうした様々なURLの大半にあてはまります。
写真
転送とは簡単に言うと「ユーザーがRにアクセスしたら、”このページのコンテンツはSにあるよ”と教えてあげて、ブラウザにもSのコンテンツが表示される」というだけです。そんな簡単なことに、なんでいろいろなタイプがあるのでしょう?それぞれの意味を確認してみましょう。

① サーバ―側での転送

サーバー側で転送するため、ユーザーがR側のコンテンツを見ることはありません。

■301転送(恒久的な転送)

サーバーが「永遠に転送を行います。中止したり、転送先が変わることはありません。」と言っているパターン。将来的にはSを利用してください、キャッシュもSにしてくださいと言っています。

Googleをはじめとした検索エンジンは大抵”S”をインデックスして、各種シグナルもRからSに移転させます。サイト移転・サイト改装・HTTPS化などでURLが永遠に切り替わる場合や、「まだ最終的なURLをどうするか決めていないけど、決まるまではこのURLに転送する」という場合にはおすすめです。

■302転送(一時的な転送)

「一時的」という通り、永遠にSに引っ越すわけではないということです。将来的にURLを元に戻したり、ユーザー・デバイス・ユーザーの所在地などに応じて転送を行う場合に使います。キャッシュはできません。

検索エンジンは大抵”R”をインデックスします。常に”S”に転送するつもりがあるのか判断できないためです。ルートURLから下層URLへの転送(例:example.com→example.com/aaa/bbb.php)や、国・デバイス・言語設定などのユーザー属性に応じて転送する場合に使いましょう。


② クライアント側での転送

サーバーはR/S両方のコンテンツを返しますが、ブラウザ側で転送を認識します。

■JavaScript転送

サーバー側での転送ができない場合、次善策としてJavaScriptを使いましょう :)
また、サイトがJavaScriptフレームワークを使っている場合、JavaScript転送以外の方法がないこともあるでしょう。

キャッシュはサーバーの設定に応じて変化します。検索エンジンは「RとSのどちらをインデックスしたらいいのかな?」と頭をひねることになります。シグナルは検索エンジンが正規URLだと判断したほうに帰属します。


■meta refresh転送

JavaScript転送の一種ですが、推奨はしません。
使ってる人もいるので、Googleがサポートを打ち切ることはないと思うけど他の方法を使ったほうがいいよ。

■307転送

「これってサーバ側転送じゃないの?」と思った人もいるよね。でも、実際にはブラウザ側で転送しているんです。例えば「HTTPS化して、HTTP→HTTPSの301を設定して、HSTSも有効にしたサイト」に対して、ブラウザでHTTP版にアクセスした場合。ブラウザはHTTPS版にアクセスするけれど、307転送として記録します。この場合、307っていうのは嘘 :)

○FAQ

■PageRankの処理は?

インデックスされたほうのバージョンに帰属します。どの転送方法を使った場合でも同じ。


■303とか304.5とかの処理は?

使う理由があるなら使っていいよ。
その場合、Google側で正規URLをどちらにするか決めることになる。「こちらをGoogleにインデックスしてほしい」という場合は、Canonicalとかの他の正規化処理も忘れずにね。


■転送数の上限は?

「RからSまでの間の転送」、つまり転送チェーンのことなら、Googleは5回までなら認識する。でも、できるだけ少なくしてね。
「1ウェブサイトあたり何件」という意味なら、上限はないです。

■RankBrainは転送をどう処理する?

RankBrainとは無関係です。


○ 最後に

ウェブページがすべて完全な設定を使っているわけではないので、検索エンジンもそれをうまく処理しないといけません。恒久的転送なのに、一時的転送の設定を利用しているサイトもありますし、逆のパターンもあります。だから、転送も検索エンジンからすると正しいURLを選び出す(=URLの正規化)のためのシグナルの一つにすぎません。

簡単に言うと、301と302の場合
301:原則的にはSをインデックス、転送をキャッシュする
302:原則的にはRをインデックス、転送をキャッシュしない

以上の点を理解して、適切な転送方法を選んでください。
わかりにくいところがあったら言ってね :)

URLの正規化についてより詳しく知りたい場合はこちらも。
=============================

以上。

正規URLを選ぶヒントとしては転送・canonicalタグなどのシグナル全般も使っているし、HTTPステータスコードについては出している期間も使っています。
「ずーっと302転送してるけど、これってもう元に戻す気ないよね。これからは転送先をインデックスするね」とか
「503(一時的に利用不能)がずーっと出てるけど、これって実質404だよね。そのうちインデックスから消すね」とか。出しっぱなしに注意。

2016年2月20日土曜日

デスクトップ検索の広告が増えたり減ったり

02/22追記:
Googleさんの修正コメントその二(リンク先一番下)で、「ナレッジグラフ内の広告も右側に出続けます」とのこと。ばたばたですねー
今回の変化を改めてまとめると、以下のようになります。

デスクトップ検索で、広告の表示位置に以下の調整:
 ① 右サイドへの広告表示がほぼ全滅
  ┗商品リスト広告(PLA)とナレッジパネル内の広告は例外で、今後も右サイドに
 ② 一部のクエリで、上部の広告が最大4つ表示



=================================================