مرداد ۸, ۱۴۰۱

آیا موتور جست‌وجوی گوگل نتایج را ‌به‌طور دستی تنظیم می‌کند؟

محمدحسین کریمی – نتایج گوگل: در پی فعال شدن SafeSearch گوگل در ایران، ویدئوی قدیمی از صحبت‌های مدیر شبکه سه در توییتر دست‌به‌دست‌ می‌شود که می‌گوید «سرچ گوگل به‌طور manual تنظیم می‌شود.» این ادعا چقدر صحت دارد؟

این‌ روزها، فضای اینترنت ایران با پیاده‌سازی SafeSearch و جست‌وجوی امن اجباری در موتور جست‌وجوی گوگل و بینگ دوباره ملتهب شده است. SafeSearch قابلیتی است که گوگل برای ایجاد محیطی نسبتاً امن در اینترنت برای کودکان در نظر گرفته و فعال کردن آن برعهده‌ی والدین است تا از کودکان خود دربرابر تهدیدات آنلاین محافظت کنند.

اما در ایران این قابلیت به‌طور اجباری و به صورت پیش‌‌فرض برای تمام کاربران فعال شده که به‌گفته‌ی عیسی زارع‌پور، وزیر ارتباطات، نتیجه‌ی خواسته‌ی خانواده‌ها بوده است. بااین‌حال، در نظرسنجی زومیت درباره اجباری شدن جست‌وجوی امن گوگل و بینگ، ۸۷٫۴۷ درصد از ۴۷۶۴ شرکت‌کننده با اجرای این طرح مخالف بودند.

از آن سو، خبر همکاری ایران و روسیه برای توسعه‌ی گزینه‌های جایگزین اپلیکیشن‌های غربی، رفع فیلتر یاندکس در ایران و قطعی موقت اینترنت ثابت در تهران دست به دست هم داد تا ویدئوی کوتاهی از صحبت‌های جنجالی علی فروغی، مدیر شبکه سوم سیما بعد از چهار سال دوباره در توییتر بین کاربران دست‌به‌دست شود.

او در این ویدئو مدعی است که سرچ گوگل manual یا همان به‌طور دستی تنظیم می‌شود و اینطور مثال می‌آورد که وقتی کاربری دارد عکس برج میلاد را جست‌وجو می‌کند، گوگل بنا به دلایلی به او «ده تا چیز مسئله‌دار» هم نشان می‌دهد.

برخی معتقدند این طرز فکر زمینه‌ساز تصمیم دولت به فعال کردن اجباری SafeSearch شده است تا از کاربران دربرابر مواجه‌ شدن با نتایج «مسئله‌دار»‌ حفاظت کند. اما آیا این ادعا درست است؟

وقتی برای آشنایی با سازوکار موتور جست‌وجوی گوگل به سند آن مراجعه می‌کنیم، همان چند کلمه‌ی ابتدایی جمله‌ی اول پاسخ سؤال ما را مشخص می‌کند:‌

Google Search is a fully-automated search engine

گوگل موتور جست‌وجوی خود را تمام خودکار معرفی می‌کند و توضیح می‌دهد که فرایند جست‌وجو در وب‌سایت‌ها و اضافه کردن اطلاعات آن‌ها به پایگاه داده توسط برنامه‌ها و بات‌هایی به نام خزنده‌ی وب (Web Crawler) انجام می‌شود.

گوگل سازوکار موتور جست‌وجوی خود را در سه مرحله توضیح می‌دهد که به‌طور کامل توسط الگوریتم‌ها و بات‌ها انجام می‌شود:‌ خزیدن در اینترنت، ایندکس کردن وب‌سایت‌ها، نمایش نتایج به کاربر.

خزنده‌های وب گوگل، بات‌های کاملاً خودکاری هستند که تصویر ارتشی از عنکبوت‌ها را در ذهن تداعی می‌کنند. این بات‌ها طبق برنامه‌ای منظم در سطح اینترنت پخش می‌شوند و به‌جست‌وجوی وب‌سایت‌های جدید و محتوای به‌تازگی منتشرشده می‌گردند تا آن‌ها را به موتور جست‌وجوی گوگل اضافه کنند.

درباره‌ی سازوکار این بات‌ها در مقاله‌ی خزنده وب چیست و چگونه کار می‌کند؟ به‌طور کامل توضیح داده شده؛ اما به‌طور کلی، این بات‌ها مبتنی بر الگوریتم هستند که به‌طور مرتب به‌روزرسانی شده و از سمت مجموعه‌ی عظیمی از کامپیوترهای مستقر در گوگل برای پیدا کردن URLها و محتوای جدید بسیج می‌شوند.

جمع‌آوری اطلاعات وب‌سایت‌ها برعهده‌ی خزنده‌های وب گوگل است

بعد از مرحله خزیدن و جمع‌آوری کاملاً خودکار اطلاعات، نوبت ایندکس کردن فرا می‌رسد. در این مرحله، برنامه‌های گوگل با پردازش و آنالیز محتوای متنی و تگ‌های کلیدی از جمله عنوان و متن‌های جایگزینی که برای تصاویر و ویدئوها نوشته‌ شده‌اند، سعی می‌کنند از محتوای وب‌سایت شما سر دربیاورند؛ مثلاً این برنامه‌ها به گوگل در فهم اینکه زومیت یک وب‌سایت تکنولوژی است، کمک می‌کنند تا نتایج مرتبطی را به کاربرانی که دنبال محتوای تکنولوژی هستند، نشان دهد. به‌همین‌خاطر، متخصصان سئو به صاحبان وب‌سایت‌ها توصیه می‌کنند در تعیین تگ‌ها و متن‌های جایگزین تصاویر دقت زیادی به‌ خرج دهند، چراکه گوگل عموماً براساس همین نشانه‌ها مرتبط بودن نتایج جست‌وجو را تعیین می‌کند. مثلاً اگر برای تصویری از برج میلاد، متن جایگزین برج آزادی را بنویسید، برنامه‌های گوگل ممکن است آن را در دسته‌بندی عکس برج آزادی قرار داده و زمانی که کاربر در جست‌وجوی تصویری از برج آزادی است، به‌ اشتباه با تصویر برج میلاد رو‌به‌رو شود.

تمام اطلاعات جمع‌آوری‌شده توسط بات‌ها و آنالیزشده توسط برنامه‌های دیگر گوگل در گوگل ایندکس ذخیره می‌شوند که درواقع پایگاه داده‌ی عظیمی است که در هزاران کامپیوتر میزبانی می‌شود. البته تمام محتوای منتشرشده در اینترنت به پایگاه داده‌ی گوگل راه پیدا نمی‌کنند؛ مثلاً اگر محتوای وب‌سایت کیفیت پایینی داشته باشد یا خود صاحب وب‌سایت دسترسی خزنده‌های وب را بسته باشد، گوگل آن‌ها را در نتایج جست‌وجو نخواهد آورد.

مرتبط بودن نتایج با عبارت براساس صدها فاکتور تعیین می‌شود

و درنهایت، زمانی که کاربر عبارتی را در گوگل سرچ می‌کند، کامپیوترهای گوگل وب‌سایت‌های ایندکس‌شده در پایگاه داده‌ی این شرکت را برای پیدا کردن صفحات مرتبط جست‌وجو می‌کنند و نتایجی را که بیشترین کیفیت و ارتباط را با درخواست کاربر دارند، نشان می‌دهند. مرتبط بودن نتایج با عبارت جست‌وجو شده نیز براساس صدها فاکتور مختلف تعیین می‌شود؛ از جمله موقعیت مکانی کاربر، زبان استفاده‌شده برای سرچ و دستگاهی که از آن جست‌وجو انجام می‌شود (دسکتاپ یا گوشی). برای مثال، نتایج جست‌وجوی «تعمیرگاه دوچرخه» در گوگل برای کاربری در پاریس و کاربر دیگری در هنگ‌کنگ متفاوت خواهد بود، چون گوگل با در نظر گرفتن موقعیت مکانی کاربر، تعمیرگاه نزدیک محل زندگی او را نشان می‌دهد.

درست است که گوگل فرشته نیست و این‌ روزها به‌خاطر قدرت و نفوذ بی‌حد‌ومرزش، زیر ذره‌بین لوایح ضدانحصاری آمریکا قرار گرفته است؛ اما دستکاری تعمدی گوگل برای نشان دادن نتایج غیرمرتبط با جست‌وجوی کاربر نوعی خودکشی شغلی است که موقعیت این غول دنیای فناوری را به‌خطر می‌اندازد. در واقع دلیل اینکه گوگل توانست به‌سرعت رقبا را کنار زده و رهبری بازار جست‌وجوی اینترنتی را به‌دست بگیرد، به‌خاطر کارآمدی الگوریتم‌ها و توانایی‌اش در تطبیق خود با خواسته‌های کاربر است. اگر گوگل قرار بود به‌جای نشان‌ دادن آن‌چیزی که کاربر در جست‌وجویش است، «ده تا چیز مسئله‌دار» را به او نشان دهد، بی‌شک اکنون محبوب‌ترین و معتبرترین موتور جست‌وجوی دنیا نبود.

دسته‌بندی‌ها:تکنولوژی ، مقالات

دیدگاه شما

لغو پاسخ