„Google“ duomenų nutekėjimo paaiškinimas | Ophthacare

Google Search Data Leak

Per JAV šventes buvo bendrinami kai kurie įrašai apie tariamą su „Google“ reitingavimu susijusių duomenų nutekėjimą. Pradiniai pranešimai apie nutekėjimą buvo skirti „patvirtinti“ seniai Rando Fishkino įsitikinimus, tačiau mažai dėmesio buvo skirta informacijos kontekstui ir tai, ką ji iš tikrųjų reiškia.

Kontekstas yra svarbus: dokumentų AI sandėlis

Nutekėjęs dokumentas yra susijęs su vieša „Google Cloud“ platforma, pavadinta „Document AI Warehouse“, kuri naudojama duomenims analizuoti, tvarkyti, ieškoti ir saugoti. Šis viešas įrašas yra pavadinimas Dokumento AI sandėlio apžvalga. VIENA paštu „Facebook“ dalijasi, kad „nutekėję“ duomenys yra viešai matomos „Document AI Warehouse“ dokumentacijos „vidinė versija“. Tai yra šių duomenų kontekstas.

Ekrano kopija: „Document AI Warehouse“.

@DavidGQuaid tviteryje:

“Manau, kad aišku, kad tai yra išorinė API, skirta dokumentų saugyklai kurti, kaip rodo pavadinimas.”

Panašu, kad tai verčia suprasti, kad „nutekėję“ duomenys yra vidinė „Google“ paieškos informacija.

Kiek šiuo metu žinome, „nutekėję duomenys“ yra panašūs į tai, kas yra viešoje „Document AI Warehouse“ svetainėje.

Vidinių paieškos duomenų nutekėjimas?

Originalus paštu „SparkToro“ nesako, kad duomenys kilę iš „Google“ paieškos. Jame teigiama, kad asmuo, kuris išsiuntė duomenis Randui Fishkinui, yra tas, kuris pateikė tokį reikalavimą.

Vienas iš dalykų, kuriais žaviuosi apie Randą Fishkiną, yra tai, kad jis labai tiksliai rašo, ypač kai kalbama apie įspėjimus. Randas teisingai pažymi, kad būtent duomenis pateikęs asmuo teigia, kad duomenys atkeliavo iš Google paieškos. Įrodymų nėra, tik kaltinimas.

Jis rašo:

„Gavau el. laišką iš kažko, teigiančio, kad turiu prieigą prie didžiulio API dokumentacijos nutekėjimo iš Google paieškos skyriaus.

Pats Fishkinas nepatvirtina, kad ankstesni „Google“ darbuotojai patvirtino, kad duomenys yra kilę iš „Google“ paieškos. Jis rašo, kad asmuo, atsiuntęs duomenis el. paštu, tokią pretenziją pareiškė.

„El. laiške taip pat buvo teigiama, kad buvę „Google“ darbuotojai patvirtino šių nutekintų dokumentų autentiškumą ir kad šie buvę darbuotojai ir kiti pasidalijo papildoma privačia informacija apie „Google“ paieškos operacijas.

Fishkinas rašo apie vėlesnį vaizdo susitikimą, kuriame informacijos nutekėjęs asmuo atskleidė, kad jo kontaktas su buvusiais Google darbuotojais buvo susijęs su susitikimu su jais paieškos pramonės renginyje. Vėlgi, turėsime priimti geiksų žodžius apie buvusius „Google“ darbuotojus ir tai, ką jie pasakė, buvo kruopščiai peržiūrėję duomenis, o ne atsitiktiniai komentarai.

Fishkinas rašo, kad dėl to susisiekė su trimis buvusiais „Google“ darbuotojais. Pažymėtina, kad šie buvę „Google“ darbuotojai aiškiai nepatvirtino, kad duomenys yra „Google“ paieškos vidiniai. Jie tik patvirtino, kad duomenys atrodo kaip vidinė „Google“ informacija, o ne tai, kad jie kilę iš „Google“ paieškos.

Fishkin rašo, ką jam pasakė buvę Google darbuotojai:

  • „Kai ten dirbau, neturėjau prieigos prie šio kodo. Bet tai tikrai atrodo teisėta.
  • “Jis turi visus vidinės Google API bruožus.”
  • “Tai Java pagrindu sukurta API. Ir kažkas praleido daug laiko, kad atitiktų “Google” vidinius dokumentacijos ir pavadinimų standartus.”
  • „Man reikėtų daugiau laiko, kad įsitikinčiau, bet tai atitinka vidinius dokumentus, su kuriais esu susipažinęs.
  • „Niekas, kurį mačiau trumpoje apžvalgoje, rodo, kad tai ne kas kita, kaip teisėta.

Teigti, kad kažkas kilęs iš „Google“ paieškos ir pasakyti, kad tai kilęs iš „Google“, yra du skirtingi dalykai.

Laikykitės atviro proto

Svarbu, kad duomenys būtų atviri, nes yra daug nepatvirtintų duomenų. Pavyzdžiui, nežinoma, ar tai vidinis paieškos komandos dokumentas. Todėl tikriausiai neverta nieko iš šių duomenų laikyti veiksmingu SEO patarimu.

Taip pat nepatartina analizuoti duomenų, siekiant konkrečiai patvirtinti ilgalaikius įsitikinimus. Taip pateksite į patvirtinimo šališkumą.

VIENA apibrėžimas patvirtinimo šališkumas:

“Patvirtinimo šališkumas yra tendencija ieškoti, interpretuoti, teikti pirmenybę ir prisiminti informaciją tokiu būdu, kuris patvirtina arba palaiko ankstesnius įsitikinimus ar vertybes.”

Patvirtinimo šališkumas paskatins žmogų neigti dalykus, kurie yra empiriškai teisingi. Pavyzdžiui, yra dešimtmečių senumo idėja, kad „Google“ automatiškai neleidžia naujai svetainei reitinguoti, ši teorija vadinama smėlio dėže. Žmonės kiekvieną dieną praneša, kad jų naujos svetainės ir nauji puslapiai beveik iš karto patenka į geriausių „Google“ paieškos dešimtuką.

Bet jei esate užkietėjęs tikėjimas smėlio dėže, tada tokia reali stebima patirtis bus pašalinta, nesvarbu, kiek žmonių pastebės priešingą patirtį.

Brenda Malone, laisvai samdoma vyresnioji SEO techninė strategė ir žiniatinklio kūrėja (LinkedIn profilis)atsiuntė man pranešimą apie kaltinimus dėl smėlio dėžės:

“Aš asmeniškai žinau, iš tikros patirties, kad smėlio dėžės teorija yra klaidinga. Aš ką tik per dvi dienas indeksavau asmeninį tinklaraštį su dviem įrašais. Jokiu būdu negalima indeksuoti mažos svetainės su dviem įrašais pagal smėlio dėžę – teoriją “.

Svarbu tai, kad jei paaiškėja, kad įrodymai yra iš „Google“ paieškos, neteisingas būdas analizuoti duomenis yra ieškoti ilgalaikių įsitikinimų patvirtinimo.

Kas yra „Google“ duomenų nutekėjimas?

Yra penki dalykai, į kuriuos reikia atsižvelgti dėl nutekėjusių duomenų:

  1. Nutekintos informacijos kontekstas nežinomas. Ar tai susiję su Google paieška? Ar jis skirtas kitiems tikslams?
  2. Duomenų tikslas. Ar informacija buvo naudojama tikriems paieškos rezultatams? O gal jis buvo naudojamas duomenims tvarkyti ar manipuliuoti viduje?
  3. Buvę „Google“ darbuotojai nepatvirtino, kad duomenys susiję su „Google“ paieška. Jie tik patvirtino, kad atrodo, kad tai iš „Google“.
  4. Laikykitės atviro proto. Jei ieškote ilgalaikių įsitikinimų pateisinimo, atspėkite, ką? Jų rasite visur. Tai vadinama patvirtinimo šališkumu.
  5. Įrodymai rodo, kad duomenys yra susiję su išorine API, kuria siekiama sukurti dokumentų saugyklą.

Ką kiti kalba apie „nutekėjusius“ dokumentus

Ryanas Jonesas, žmogus, turintis ne tik didelę SEO patirtį, bet ir puikiai išmanantis kompiuterių mokslą, pasidalijo keletu protingų pastebėjimų apie vadinamąjį duomenų nutekėjimą.

Ryanas tviteryje:

„Nežinome, ar jis skirtas gamybai, ar bandymams. Spėju, kad jis daugiausia skirtas galimiems pokyčiams išbandyti.

Mes nežinome, kas naudojama žiniatinkliui ar kitoms vertikalioms sritims. Kai kurie dalykai gali būti naudojami tik „Google Home“, naujienoms ir pan.

Mes nežinome, kas yra įvestis į ML algoritmą ir prieš ką naudojama treniruotis. Spėju, kad paspaudimai nėra tiesioginė įvestis, o naudojami modeliui, kaip nuspėti spustelėjimą. (Padidėja išorinės tendencijos)

Taip pat spėju, kad kai kurie iš šių laukų taikomi tik mokymo duomenų rinkiniams, o ne visoms svetainėms.

Ar aš sakau, kad „Google“ nemelavo? Visai ne. Tačiau ištirkime šį nutekėjimą objektyviai ir neturėdami išankstinio nusistatymo.

@DavidGQuaid tviteryje:

„Mes taip pat nežinome, ar tai skirta „Google“ paieškai, ar „Google Cloud“ dokumentų gavimui

Panašu, kad API renkasi – taip nesitikiu, kad algoritmas veiktų – ką daryti, jei inžinierius nori praleisti visus šiuos kokybės patikrinimus – atrodo, kad noriu sukurti turinio parduotuvės programą savo įmonės žinių bazei.

Ar „nutekėję“ duomenys yra susiję su „Google“ paieška?

Šiuo metu nėra įrodymų, kad šie „nutekėję“ duomenys iš tikrųjų yra iš „Google“ paieškos. Kyla didžiulis neaiškumų, koks yra duomenų tikslas. Pažymėtina, kad yra užuominų, kad šie duomenys yra tik „išorinė API, skirta dokumentų saugyklai sukurti, kaip rodo pavadinimas“, ir niekaip nesusiję su svetainių reitingavimu „Google“ paieškoje.

Išvada, kad šie duomenys buvo gauti ne iš „Google“ paieškos, šiuo metu nėra galutinė, tačiau atrodo, kad būtent tokia kryptimi pučia įrodymų vėjas.

Teminis vaizdas, kurį pateikė Shutterstock / Jaaak

Leave a Reply

Your email address will not be published. Required fields are marked *