หยุดผีสแปมใน Google Analytics กับตัวกรอง

สแปมใน​​Google Analytics (GA) ได้กลายเป็นปัญหาร้ายแรง เนื่องจากน้ำท่วมของสแปมการอ้างอิงจากปุ่มสังคม, เว็บไซต์สำหรับผู้ใหญ่และหลายแหล่งข้อมูลอื่น ๆ หลายคนเริ่มที่จะกลายเป็นจมโดยฟิลเตอร์ทั้งหมดที่พวกเขามีการตั้งค่าในการจัดการข้อมูลที่ไร้ประโยชน์ที่พวกเขาจะได้รับ

ข่าวดีก็คือมีไม่จำเป็นต้องตกใจ ในบทความนี้ผมจะให้ความสำคัญกับความผิดพลาดที่พบบ่อยที่สุดทำให้คนเมื่อการต่อสู้สแปมใน GA และอธิบายวิธีที่มีประสิทธิภาพในการป้องกันไม่ให้มัน

แต่ก่อนอื่นขอให้แน่ใจว่าเราเข้าใจวิธีการทำงานของสแปม สองสามเดือนที่ผ่านมาเจเร็ดการ์ดเนอร์เขียนบทความดีอธิบายสิ่งที่สแปมอ้างอิงคือรวมถึงวัตถุประสงค นอกจากนี้เขายังชี้ให้เห็นตัวอย่างที่ดีบางส่วนของสแปมอ้างอิง

ประเภทของขยะ

สแปมใน Google Analytics สามารถแบ่งได้โดยทั้งสองประเภท: ผีและซอฟต์แวร์รวบรวมข้อมูล

ผี

ส่วนใหญ่ของสแปมประเภทนี้ พวกเขาจะเรียกผีเพราะพวกเขาไม่เคยเข้าถึงเว็บไซต์ของคุณ มันเป็นสิ่งสำคัญที่จะเก็บไว้ในใจเป็นมันที่สำคัญในการสร้างโซลูชั่นที่มีประสิทธิภาพมากขึ้นสำหรับการจัดการสแปม

ในฐานะที่เป็นที่ผิดปกติเป็นเสียงสแปมประเภทนี้ไม่ได้มีปฏิสัมพันธ์กับเว็บไซต์ของคุณที่ทั้งหมด คุณอาจสงสัยว่าเ​​ป็นไปได้ตั้งแต่หนึ่งในวัตถุประสงค์หลักของ GA คือการติดตามการเข้าชมเว็บไซต์ของเรา

พวกเขาทำมันโดยใช้โปรโตคอลการวัดซึ่งจะช่วยให้คนที่จะส่งข้อมูลโดยตรงไปยังเซิร์ฟเวอร์ของ Google Analytics ใช้วิธีนี้และรหัสติดตามอาจจะสร้างแบบสุ่ม (UA-XXXXX-1) เป็นอย่างดีส่งอีเมลขยะออกจาก "เยี่ยมชม" กับข้อมูลปลอมโดยไม่ได้รู้ว่าเขาเป็นใครตี

โปรแกรมรวบรวมข้อมูล

ประเภทนี้สแปมตรงกันข้ามกับสแปมผีไม่เข้าถึงเว็บไซต์ของคุณ เป็นชื่อที่มีความหมายเหล่านี้สแปมบอทที่รวบรวมข้อมูลหน้าเว็บของคุณโดยไม่สนใจกฎระเบียบเช่นเดียวกับที่พบใน robots.txt ที่ควรจะหยุดพวกเขาจากการอ่านเว็บไซต์ของคุณ เมื่อพวกเขาออกจากเว็บไซต์ของพวกเขาออกจากบันทึกในรายงานที่ปรากฏคล้ายกับการเยี่ยมชมการถูกต้องตามกฎหมาย

โปรแกรมรวบรวมข้อมูลยากที่จะระบุเพราะพวกเขารู้ว่าเป้าหมายของพวกเขาและใช้ข้อมูลจริง แต่มันก็ยังเป็นความจริงที่คนใหม่ไม่ค่อยปรากฏ ดังนั้นหากคุณตรวจสอบการอ้างอิงในการวิเคราะห์ของคุณที่มีลักษณะน่าสงสัย, การวิจัยใน Google หรือการตรวจสอบกับรายการนี​​้อาจช่วยให้คุณตอบคำถามที่ว่าหรือไม่ก็เป็นสแปม

ความผิดพลาดที่พบมากที่สุดที่ทำเมื่อต้องรับมือกับสแปมในจอร์เจีย

ฉันได้รับการต่อไปปัญหานี้อย่างใกล้ชิดไม่กี่เดือนที่ผ่านมา ตามที่ความคิดเห็นของคนที่ได้ทำเกี่ยวกับบทความและการสนทนาของฉันฉันได้พบในฟอรั่มการอภิปรายมีหลักสามข้อผิดพลาดทำให้คนเมื่อจัดการกับขยะใน Google Analytics

ความผิดพลาด # 1 การป้องกัน Spam ผีจาก htaccess ไฟล์

หนึ่งในความผิดพลาดที่ยิ่งใหญ่ที่สุดคนทำพยายามที่จะป้องกันผีสแปมจาก htaccess ไฟล์

สำหรับผู้ที่ไม่คุ้นเคยกับไฟล์นี้เป็นหนึ่งในหน้าที่หลักของมันคือการอนุญาต / ปิดกั้นการเข้าถึงเว็บไซต์ของคุณ ตอนนี้เรารู้ว่าผีไม่เคยไปถึงเว็บไซต์ของคุณเพื่อเพิ่มพวกเขาที่นี่จะไม่ได้มีผลกระทบใด ๆ และจะเพิ่มบรรทัดไม่มีประโยชน์ที่จะ htaccess ไฟล์ของคุณ

ผีสแปมมักจะแสดงขึ้นในอีกไม่กี่วันแล้วหายไป เป็นผลให้บางคนคิดว่าพวกเขาประสบความสำเร็จในบล็อกได้จากที่นี่เมื่อจริงๆมันเป็นแค่เรื่องบังเอิญของการกำหนดเวลา

จากนั้นเมื่อผู้ส่งอีเมลขยะในภายหลังกลับมาพวกเขาได้รับความกังวลใจเพราะการแก้ปัญหาไม่ได้ทำงานอีกต่อไปและพวกเขาคิดว่าสแปมเมอร์อย่างใดข้ามอุปสรรคที่พวกเขาตั้งค่า

ความจริงก็คือ htaccess ไฟล์เพียงอย่างมีประสิทธิภาพสามารถป้องกันการรวบรวมข้อมูลเช่น buttons-for-website.com และอื่น ๆ น้อยตั้งแต่เหล่านี้เข้าถึงเว็บไซต์ของคุณ ส่วนใหญ่ของสแปมไม่สามารถปิดกั้นการใช้วิธีนี้จึงมีไม่มีทางเลือกอื่นนอกเหนือจากการใช้ฟิลเตอร์เพื่อแยกพวกเขา

ความผิดพลาด # 2 ใช้รายการยกเว้นการอ้างอิงที่จะหยุดสแปม

ข้อผิดพลาดก็คือการพยายามที่จะใช้รายการการอ้างอิงการยกเว้นที่จะหยุดสแปม ชื่ออาจสร้างความสับสนให้คุณ แต่รายการนี​​้ไม่ได้มีเจตนาที่จะไม่รวมการอ้างอิงในทางที่เราต้องการสำหรับสแปม มันมีวัตถุประสงค์อื่น ๆ

ตัวอย่างเช่นเมื่อลูกค้าซื้อบางสิ่งบางอย่างบางครั้งพวกเขาได้รับการเปลี่ยนเส้นทางไปยังหน้าของบุคคลที่สามสำหรับการชำระเงิน หลังจากการชำระเงินที่พวกเขาจะถูกนำกลับไปยังเว็บไซต์ของคุณและ GA บันทึกไว้ว่าเป็นการแนะนำผลิตภัณฑ์ใหม่ มันเป็นความเหมาะสมที่จะใช้รายการยกเว้นการอ้างอิงเพื่อป้องกันไม่ให้เกิดเหตุการณ์เช่นนี้

ถ้าคุณพยายามที่จะใช้รายการยกเว้นการอ้างอิงในการจัดการสแปม แต่ส่วนอ้างอิงจะถูกปล้นเนื่องจากไม่มีการบันทึกมาก่อน เป็นผลให้การเข้าชมโดยตรงจะถูกบันทึกไว้และคุณจะมีปัญหาใหญ่กว่าหนึ่งที่คุณเริ่มต้นด้วยการตั้งแต่ คุณจะยังคงมีสแปมและการเข้าชมโดยตรงยากที่จะติดตาม

ความผิดพลาด # 3 กังวลว่าการเปลี่ยนแปลงอัตราการตีกลับจะมีผลต่อการจัดอันดับ

เมื่อมีคนเห็นว่าการเปลี่ยนแปลงของอัตราการตีกลับอย่างมากเพราะของสแปมพวกเขาเริ่มกังวลเกี่ยวกับผลกระทบที่จะมีต่อการจัดอันดับของพวกเขาใน SERPs

นี้เป็นความผิดพลาดอื่นทำกันทั่วไป มีหรือไม่มีสแปม Google ไม่ได้ใช้เวลาในการพิจารณาตัวชี้วัดของ Google Analytics เป็นปัจจัยการจัดอันดับ นี่คือคำอธิบายเกี่ยวกับเรื่องนี้จาก Matt Cutts อดีตหัวหน้าทีมสแปมเว็บของ Google

และถ้าคุณคิดเกี่ยวกับมันคำอธิบาย Cutts 'ทำให้รู้สึก; เพราะแม้ว่าจะมีหลายคนมี GA ทุกคนไม่ได้ใช้มัน

สมมติว่าเว็บไซต์ของคุณได้ถูกแฮ็ก

อีกความกังวลร่วมกันเมื่อมีคนเห็นหน้า Landing Page ที่แปลกมาจากสแปมในรายงานของพวกเขาคือการที่พวกเขาได้ถูกแฮ็ก

หน้าเว็บที่สแปมที่แสดงให้เห็นในรายงานไม่ได้อยู่และถ้าคุณพยายามที่จะเปิดมันคุณจะได้รับ 404 หน้า เว็บไซต์ของคุณยังไม่ได้รับการโจมตี

แต่คุณต้องให้แน่ใจว่าหน้าไม่ได้อยู่ เพราะมีกรณี (ไม่ใช่สแปม) ที่เว็บไซต์บางแห่งมีการละเมิดความปลอดภัยและได้รับการฉีดหน้าเต็มคำที่ดีที่จะทำให้เสียชื่อเสียงเว็บไซต์

สิ่งที่คุณควรกังวลเกี่ยวกับอะไร?

ตอนนี้เราได้ทิ้งปัญหาด้านความปลอดภัยและผลกระทบของพวกเขาในการจัดอันดับสิ่งเดียวที่เหลือที่จะต้องกังวลเกี่ยวกับข้อมูลของคุณ เส้นทางปลอมที่สแปมใบหลังมลพิษรายงานของคุณ

มันอาจจะมีผลกระทบมากหรือน้อยขึ้นอยู่กับอัตราการเข้าชมเว็บไซต์ของคุณ แต่ทุกคนมีความไวต่อการสแปม

เว็บไซต์ขนาดเล็กและขนาดกลางจะมีผลกระทบได้ง่ายที่สุด - ไม่เพียงเพราะเป็นส่วนใหญ่ของการเข้าชมของพวกเขาสามารถเป็นสแปม แต่ยังเพราะมักเว็บไซต์เหล่านี้มีการจัดการด้วยตนเองและบางครั้งก็ไม่ได้รับการสนับสนุนจากนักวิเคราะห์หรือผู้ดูแลเว็บที่

เว็บไซต์ขนาดใหญ่ที่มีจำนวนมากเข้าชมยังสามารถรับผลกระทบจากสแปมและแม้ว่าผลกระทบอาจจะไม่มีนัยสำคัญการจราจรที่ไม่ถูกต้องหมายถึงการรายงานที่ไม่ถูกต้องไม่ว่าขนาดของเว็บไซต์ เป็นนักวิเคราะห์ที่คุณควรจะสามารถที่จะอธิบายสิ่งที่เกิดขึ้นแม้ในรายงานที่ละเอียดที่สุด

คุณต้องการเพียงหนึ่งตัวกรองเพื่อจัดการกับขยะผี

โดยปกติก็จะแนะนำให้เพิ่มการอ้างอิงไปยังตัวกรองการยกเว้นหลังจากที่มันเป็นด่าง แม้ว่านี่จะเป็นประโยชน์สำหรับการกระทำอย่างรวดเร็วจากสแปมก็มีข้อเสียใหญ่สาม

  • ทำให้ฟิลเตอร์ทุกสัปดาห์ทุกสแปมใหม่ที่ตรวจพบไม่น่าเบื่อและใช้เวลานานโดยเฉพาะอย่างยิ่งหากคุณจัดการเว็บไซต์จำนวนมาก นอกจากนี้ตามเวลาที่คุณใช้ตัวกรองและจะเริ่มทำงานคุณมีข้อมูลที่ได้รับผลกระทบบางส่วน
  • บางส่วนของสแปมเมอร์ใช้เข้าชมโดยตรงพร้อมกับการแนะนำผลิตภัณฑ์
  • ฮิตโดยตรงเหล่านี้จะไม่หยุดโดยตัวกรองดังนั้นแม้ว่าคุณจะไม่รวมการอ้างอิงคุณจะงัวได้รับการจราจรที่ไม่ถูกต้องซึ่งจะอธิบายว่าทำไมบางคนได้เห็นเข็มที่ผิดปกติในการเข้าชมโดยตรง

โชคดีที่มีเป็นวิธีที่ดีเพื่อป้องกันไม่ให้ปัญหาเหล​​่านี้ ส่วนใหญ่ของสแปม (ผี) ทำงานโดยการกดปุ่มของ GA สุ่มติดตามรหัสหมายถึงผู้กระทำผิดไม่ได้จริงๆรู้ว่าใครเป็นเป้าหมายและด้วยเหตุผลว่าทั้งชื่อโฮสต์ไม่ได้ตั้งค่าหรือจะใช้หนึ่งปลอม (ดูรายงานด้านล่าง)

ผี Spam.png

คุณจะเห็นว่าพวกเขาใช้ชื่อแปลก ๆ บางอย่างหรือไม่ได้รำคาญที่จะตั้งหนึ่ง แม้ว่าจะมีบางชื่อที่รู้จักกันในรายการเหล่านี้จะสามารถเพิ่มได้อย่างง่ายดายโดยผู้ส่งสแปม

ในทางตรงกันข้ามการจราจรที่ถูกต้องมักจะใช้ชื่อโฮสต์จริง ในส่วนของคดีนี้จะเป็นโดเมน แต่ก็ยังสามารถเป็นผลมาจากการชำระค่าบริการ, บริการแปลภาษาหรือสถานที่อื่น ๆ ที่คุณได้แทรกโค้ดติดตาม GA


เวลาโพสต์: 2015/08/10