گوگل الگوریتم Indexing جدیدی را به نام کافئین (Caffeine) به اتمام رساند. شما در روش ایندکس قبلی ابتدا باید سعی می کردید که وب سایت خود را به پایین ترین لایه گوگل معرفی می کردید (مانند شکل زیر) و سپس گوگل سایت هایی که در لایه های مختلف بودند در بازه زمانی مشخص شروع به Crawl کرده و سپس ایندکس می کرد. سایت هایی که در لایه بالاتر بودن بیشتر از لایه های پایین تر در همان بازه زمانی بررسی می شدند. بنابراین برای بروز رسانی تمام لایه ها، زمانی برابر با Crawl تمام وب لازم بود.
این زمان برای دنیای امروز که دنیای زمان واقعی (Real-time) است اصلا مناسب نیست.
از طرف دیگر Crawler گوگل به متن حساس است و دنیای امروز دیگر دنیای متن نیست. دنیایی است که تصویر، ویدئو و صدا حرف اول را می زنند. گوگل به عنوان معتبرترین موتور جستجوی دنیا باید از پس این مهم بر آید. البته ما مطلبی با عنوان
خداحافظ گوگل و سلام وب سمانتیک مطرح کردیم. گوگل نشان داد با هر تغییری خود را سازگار می کند و به ما مجدد سلام می کند.
در شکل بالا، در روش جدید همان لایه ها وجود دارند ولی به نوعی دیگر آنها ایندکس خواهند شد. Caffeine در صورت فعال شدن می تواند Page Rank شما را تغییر دهد.
گوگل چند روز پیش در
بلاگ خود اعلام کرد که کار این الگوریتم ایندکس به پایان رسیده است. اما صفحه ای که قبلا برای بازخورد گرفتن (Feedback) در
این آدرس ساخته بود امروز در دسترس نیست.
من چند روز است که درباره این مطلب تحقیق می کنم ولی هنوز خروجی جستجوی گوگل که بر اساس این الگوریتم باشد را نیافتم. البته بسیاری از بلاگ های آی تی هم بسیار سر بسته به این موضوع اشاره کرده اند و به همان مطالبی که در بلاگ گوگل آمده است بسنده کرده اند. بسیاری از بلاگ نویس ها موضوعات جالبی را بررسی کردند که هنوز صحت آنها مورد تایید من نیست. مثلا دوستی در تویتر اعلام کرد که با این الگوریتم صفحات شما هر 10 ثانیه ایندکس خواهد شد.
حال اینکه دقیقا کافئین چه می کند موضوعی است که شاید برای همه مهم نباشد و واقعا پیچیده باشد ولی آنچه اهمیت دارد آن است که چگونه این الگوریتم بر رتبه سایت شما در موتور جستجوی گوگل تاثیر گذار خواهد بود. این مطلبی است که فردا به آن می پردازم.
 |
یک متفکر و تحلیل گر تکنولوژی های نوین
|
کافئین یک الگوریتم ایندکس کردن نیست! کافئین یک نگاه دیگر یا به عبارتی یک سیستم دیگر برای ایندکس کردن اطلاعات هست! منظور از اطلاعات هرگونه داده هست از متن سایت ، عکس ، ویدئو و حتی کامنت یا تویت افراد. در این سیستم جدید سرعت ایندکس اطلاعات به دلیلی که اطلات پارالل پالایش میشوند (توضیحی که تقریبا رضا داده) بسیار بیشتر است! فضای اطلاعتی که ذخیره میشود کاهش یافته! سرعت ذخیره کردن اطلاعات افزایش یافته! و احتیاجی به پالیش های تکراری صفحات نیست فقط اطلاعات جدید اضافه میگردند! که این به دلیل این هست که این سیستم جدید قادر می باشد اطلاعات را در ابعاد محدود تری بررسی کند!
من یک توضیح برای پاراگراف اول بدم. مثلا فرض کنید که می خواید برگه های امتحانی را صحیح کنید و بر اساس نمره به من گزارش بدید. شما برگه ها را زیر هم می گذارید و شروع به صحیح کردن می کنید.
برگه اول را صحیح می کنید ولی هنوز نمی توانید به من گزارش بر اساس رتبه ها را بدهید چون تمام برگه ها را تصحیح نکرده اید. ممکن است یک برگه را 2 بار مورد بررسی قرار دهید ولی باز هم هنوز نمی توانید گزارش معتبر به من بدهید.
زمانی گزارش شما معتبر است که تمام برگه ها را صحیح کرده باشید و بر اساس آن دسته بندی انجام داده باشید برای همین است که
برای بروز رسانی تمام لایه ها، زمانی برابر با Crawl تمام وب لازم بود.