ஆந்த்ரோபிக் க்ளோட்போட் இணைய தேட்கயிற்றின் விவாதம்
ஆந்திரொபிக் தனது ஏஐ மாதிரிகளுக்கான பயிற்சித் தரவுகளைத் திருடுவதற்காகப் பயன்படுத்தும் க்ளோட்போட் இணைய தேட்கயிற்று, ஒரு நாளில் iFixit இணையதளத்திற்குப் பிரமாண்டமாக ஒரு மில்லியன் கோரிக்கைகளை விடுக்கவிடுத்துவிட்டமைக்கு பின் சட்ட மற்றும் உரிமை குறித்த முக்கிய விவாதங்களை எழுப்பியுள்ளது. இந்த செயல்பாடு க்ளோட்போட் iFixit இன் பயன்பாட்டு நிபந்தனைகளை மீறுவதாகக் கேள்விகளை எழுக் க்கின்றது.
iFixit CEOயின் அனுமதியின்றி திருடுதல் குறித்து பதிலளிப்பு
சார்பான பதிலுக்கு, iFixit CEO கயல் வீயன்ஸ் X (முன்னணி ட்விட்டர்) இல் இந்த மீறலை முன்னணி செய்யப்பட்ட புகைப்படங்களுடன் மதிப்பீடு செய்தார், க்ளோட்போட் iFixit இன் உள்ளடக்கத்தை அணுகுதலில் தடையைக் கவனித்ததை கண்காணிக்கிறது. வீயன்ஸ் நிகழ்வுக்கான நிறுவனத்தின் கவலைகளை விளக்கினார், "எப்போதும் அந்த கோரிக்கைகள் எங்கள் சேவையாக்க சட்டத்தை அணுகினால், எங்கள் உள்ளடக்கத்தைப் பயன்படுத்துவது முழுமையாக தடிக்கப்பட்டதாக உங்களுக்கு கூறுவார்கள். ஆனால் என்னை கேட்காதே, க்ளோட்போட்டை கேளுங்கள்!" மேலும் அவர் கூறினார், "நீங்கள் எங்கள் உள்ளடக்கத்தை கொடுக்காமல் மட்டும் இல்லை, நீங்கள் எங்கள் டெவோப்ஸ் வளங்களை குட்டிக் கட்டுகிறீர்கள்."
அதிகமான தேடுதலின் தொழில்நுட்ப விளைவுகள்
வீயன்ஸ் இந்த அதிகமான கோரிக்கைகளின் முக்கியமான தாக்கங்களை விவரித்தார், அவை அவர்களது நோக்கங்களைப் பாதுகாப்பதற்கான அழைப்பு முறைமைகளை செயல்படுத்தியது. "தேடுதலின் அதிர்வுகள் மிகவும் அதிகமாக இருந்த காரணமாக, இது எங்கள் எல்லா அழைப்புகளை கிளம்பியது மற்றும் எங்கள் டெவோப்ஸ் குழுவைப் பெரிதும் கவலையில் இட்டது" என்று அவர் The Verge க்கு விளக்கினார். இணையத்தில் மிக அதிகமாக பார்வையிடப்படும் தளங்களில் ஒன்றாக, iFixit இணைய தேட்கயிற்றுகளை கையாள்வில் பழகியுள்ளது; இருப்பினும், க்ளோட்போட்டின் செயல்பாட்டு நிலை அவசரமாகவும் மற்றும் கில்லிலாததாகவும் இருந்தது.
பயன்பாட்டு விதிகள் மற்றும் ஒத்திசைப்பு பிரச்சனைகள்
iFixit இன் பயன்பாட்டு விதிகளின்படி, அவர்களது இணையதளத்திலிருந்து உள்ளடக்கத்தை புன்செயல், நகலெடுத்தல் அல்லது விநியோகிப்பது முன்னணி எழுதுகருதேன லைப், இந்த தடைகள் ஏஐ மாதிரிகளின் பயிற்சியை குறிப்பாக அடிப்படையில் உள்ளன. இதற்குப் பின், 404 மீடியாவால் கேட்கப்பட்ட கேள்விகளுக்கு, ஆந்திரொபிக் ஒரு FAQ பக்கம் குறிப்பிடும்படி கூறியது ஏற் களவியல் தரவு நபர்களைக் களைக்கலாம் என்பது.
தேடுதலின் இடைவெளி அமலாக்கம்
இந்த நிகழ்வுகளைத் தொடர்ந்து, iFixit தனது robots.txt கோப்புக்கு ஒரு crawl-delay நீட்டிப்பைச் சேர்த்துள்ளது. "எங்கள் பதிவுகளில் கூறப்படும் பொது, அவர்கள் அதை robots.txt இல் சேர்க்குவதற்குப் பிறகு நிறுத்தினர்" என்று வீயன்ஸ் கூறினார். ஆந்த்ரோபிக்கின் ஒரு பேச்சாளர் இந்த ஒத்திசைப்பு ஐய நீட்டித்ததை உறுதிப்படுத்தினார், "நாங்கள் robots.txt ஐ மதிக்கிறோம், மற்றும் எங்கள் தேட்கயிற்று iFixit அதை பாலிக்கும்போது அதற்கு மதிப்பு கொடுத்தது." இந்த வளர்ச்சி iFixit மற்றும் ஆந்த்ரோபிக்கில் முந்தைய நிலைமையை தற்காலிகமாக பூர்த்திசெயர்வதாகப் பறிக்கையளிக்கின்றது.
மற்ற இணையதளங்களில் தொடர்புடைய பிரச்சனைகள்
இந்த சம்பவம் தனியாரானது அல்ல, ஏரி ஹோல்ச்சர் மற்றும் ஃப்ரீலான்சர்.காம் CEO மேட் பாரியின் மாதிரியுடன் இணையானது போன்ற பிற இணையதள உரிமையாளர்கள், ஆந்த்ரோபிக்கின் இணைய தேட்கயிற்றுடன் இப்படி சம்பவங்களைப் புகாரளித்துள்ளார்கள். ரெடிடில் உள்ள பயனர்கள் இவ்வறு அளவுக்கு மேலிடும் அருகில் களவி கூடியது என்று ஒன்று ஞாபகம் என்றே கூறப்படுகின்றது. லினக்ஸ் மின்ட் இணையதளமானது, க்ளோட்போட் மூலம் அதிகமான பயன்பாட்டால் மின் கருத்துகளை அனுபவித்தது.
இணைய தேட்கயிற்றுகளை நிர்வகிக்க robots.txt இன் எல்லைகளை
இணைய தேட்கயிற்றின் செயல்பாட்டை நிர்வகிக்க robots.txt கோப்புகளில் நம்பிக்கை வைப்பது தொழில்நுட்பத்தில் மிகக் கேள்விக்குள்ளமானதாகும். பல ஏஐ நிறுவனங்கள், OpenAI உட்பட, இந்த முறையைப் பயன்படுத்துகின்றன, ஆனால் இது வேறு scraping நிலைகள்களை வரையறுப்பதற்கான மிகக் குறைந்த நெகிழ்வை வழங்குகிறது. மேலும், Perplexity போன்ற நிறுவனங்கள் இந்த விலகல்களை முழுமையாக புறக்கணித்ததாகச் சொல்கின்றனர். இப்போதும், தற்சமயம் ரெடிட் போன்ற சில நிறுவனங்கள் தரவுப் பாதுகாப்பிற்கான இணைய தேட்கயிற்றில் கடுமையான கட்டுப்பாடுகளை நடைமுறைபடுத்தத் தொடங்கியுள்ளன.
முடிவில்: ஆந்த்ரோபிக்கின் க்ளோட்போட் iFixit இல் இருந்து தரவுப் பெறுதல் பற்றிய சம்பவம் செயற்கை அறிவியல் பயிற்சியின் நடைமுறை மற்றும் இணையதள உரிமையாளர்களின் உரிமைகளைப் பாதுகாக்கும் நடைமுறைகளை முன்னிலைப்படுத்துகிறது. இந்த நிலைமை தரவுப் பயன்பாடு மற்றும் நியாயமான ஏஐ பயிற்சிக்கான சிறந்த நடைமுறைகள் பற்றிய தொடர்ச்சியான விவாதங்களை ஊகிக்கிறது.
Leave a comment
All comments are moderated before being published.
This site is protected by hCaptcha and the hCaptcha Privacy Policy and Terms of Service apply.