انتھروپک کے کلاڈ بوٹ ویب کرالر کے گرد متنازعہ
کلاڈ بوٹ ویب کرالر، جسے انتھروپک نے اپنے AI ماڈلز کے لیے تربیتی ڈیٹا جمع کرنے کے لیے استعمال کیا، نے اہم متنازعہ پیدا کر دیا ہے جب اس نے رپورٹ کے مطابق ایک ہی دن میں iFixit کی ویب سائٹ پر تقریباً ایک ملین درخواستوں کے ساتھ حملہ کیا۔ یہ رویہ iFixit کی شرائط استعمال کی مطابقت کے بارے میں سنجیدہ سوالات اٹھاتا ہے۔
iFixit کے CEO کا غیر مجاز اسکریپنگ پر ردعمل
ایک مضبوط جواب میں، iFixit کے CEO کائل ویئنز نے X (سابقہ ٹوئٹر) پر اس خلاف ورزی کو اجاگر کرنے کے لیے اہم تصاویر پوسٹ کیں جو ظاہر کرتی ہیں کہ کلاڈ بوٹ نے iFixit کے مواد تک رسائی پر پابندی تسلیم کی۔ ویئنز نے اس صورت حال کے بارے میں کمپنی کے خدشات کا اظہار کیا، بیان کیا، "اگر ان میں سے کوئی درخواست ہماری خدمات کی شرائط تک رسائی حاصل کرتی تو وہ آپ کو بتاتے کہ ہمارے مواد کا استعمال سختی سے ممنوع ہے۔ لیکن مجھ سے مت پوچھیں، کلاڈ سے پوچھیں!" انہوں نے مزید زور دیا، "آپ نہ صرف ہمارا مواد بغیر ادائیگی کے لے رہے ہیں، آپ ہماری ڈیویوپس وسائل کو بھی روکے ہوئے ہیں۔"
زیادہ کرالنگ کے تکنیکی اثرات
ویئنز نے ان اضافی درخواستوں کے اہم اثرات کی وضاحت کی، جنہوں نے ان کے بنیادی ڈھانچے کے تحفظ کے لیے متعین الرٹ سسٹمز کو چالو کیا۔ "کرالنگ کی رفتار اتنی زیادہ تھی کہ اس نے ہمارے تمام الارمز کو بجایا اور ہماری ڈیویوپس ٹیم کو متوجہ کیا،" انہوں نے دی ورج کو بتایا۔ انٹرنیٹ کی سب سے زیادہ دیکھی جانے والی ویب سائٹس میں سے ایک ہونے کے ناطے، iFixit ویب کرالرز کو سنبھالنے کی عادی ہے؛ تاہم، کلاڈ بوٹ کی سرگرمی کی سطح غیر معمولی اور زیادہ تھی۔
استعمال کی شرائط اور مطابقت کے مسائل
iFixit کی استعمال کی شرائط کے مطابق، ان کی ویب سائٹ سے مواد کی کوئی بھی نقل، کاپی یا تقسیم بغیر پیشگی تحریری اجازت کے سختی سے ممنوع ہے۔ یہ پابندی خاص طور پر AI ماڈلز کی تربیت کو بھی شامل کرتی ہے۔ اس کے باوجود، 404 میڈیا کے سوالات کے جواب میں، انتھروپک نے ایک FAQ صفحے کی طرف اشارہ کرتے ہوئے اصرار کیا کہ ان کا کرالر صرف ایک robots.txt فائل توسیع کے ذریعے روکا جا سکتا ہے۔
کرال-ڈیلی کی تنصیب
ان واقعات کے بعد، iFixit نے اپنی robots.txt فائل میں ایک کرال-ڈیلی توسیع شامل کی ہے۔ "ہماری لاگ کے مطابق، انہوں نے اس کے بعد رکنا شروع کر دیا جب ہم نے اسے robots.txt میں شامل کیا،" ویئنز نے دعویٰ کیا۔ انتھروپک کے ایک ترجمان نے اس مطابقت کی تصدیق کرتے ہوئے کہا، "ہم robots.txt کی عزت کرتے ہیں اور ہمارا کرالر اس سگنل کی عزت کرتا ہے جب iFixit نے اسے نافذ کیا۔" یہ پیشرفت iFixit اور انتھروپک کے درمیان مسئلے کے عارضی حل کی اشارہ کرتی ہے۔
ایک وسیع مسئلہ: دیگر ویب سائٹوں کے تجربات
یہ واقعہ ایک الگ کیس نہیں ہے، کیونکہ دیگر ویب سائٹوں کے آپریٹرز، جیسے Read the Docs کے شریک بانی ایرک ہولشر اور Freelancer.com کے CEO میٹ بیری، نے انتھروپک کے ویب کرالر کے ساتھ اسی طرح کے مسائل کی رپورٹ پیش کی ہے۔ Reddit جیسے پلیٹ فارمز پر صارفین نے بھی تشویش کا اظہار کیا، سال کے آغاز میں کلاڈ بوٹ کی وجہ سے اسکریپنگ کی سرگرمی میں نمایاں اضافہ کا حوالہ دیتے ہوئے۔ لینکس منٹ ویب فورم، مثال کے طور پر، نوٹ کیا کہ اس کی ویب سائٹ کلاڈ بوٹ سے زیادہ بوجھ کی وجہ سے متاثر ہوئی۔
ویب اسکریپنگ کنٹرول کے لیے robots.txt کی محدودیتیں
ویب کرالر کے رویے کو کنٹرول کرنے کے لیے robots.txt فائلوں پر انحصار کرنے کا موضوع صنعت میں متنازعہ ہے۔ حالانکہ بہت سی AI کمپنیاں، بشمول اوپن ای آئی، اس طریقے کو استعمال کرتی ہیں، یہ مختلف اسکریپنگ حالات کو بیان کرنے کے لیے بہت کم لچک فراہم کرتی ہیں۔ اس کے علاوہ، Perplexity جیسی کمپنیوں نے ان exclusions کو براہ راست نظرانداز کرنے کی صورت میں رپورٹ کیا ہے۔ چیلنجز کے باوجود، کچھ تنظیمیں، جیسے Reddit، نے اپنی ڈیٹا کی سالمیت کو محفوظ رکھنے کے لیے ویب کرالرز پر سخت کنٹرول نافذ کرنا شروع کر دیا ہے۔
نتیجہ: انتھروپک کے کلاڈ بوٹ کے ذریعے iFixit کے اسکریپنگ کے واقعے نے AI تربیتی طریقوں اور ویب سائٹ مالکان کے اپنے مواد کے تحفظ کے حقوق کے درمیان جاری تناؤ کی نشاندہی کی ہے۔ یہ صورت حال ڈیٹا کے استعمال اور اخلاقی AI تربیت کے بہترین طریقوں پر مزید بحث کی ضرورت کی نشاندہی کرتی ہے۔
Leave a comment
All comments are moderated before being published.
This site is protected by hCaptcha and the hCaptcha Privacy Policy and Terms of Service apply.