Modelet e AI si ato gjuhësore të familjes GPT, në bazë të ChatGPT dhe shërbimeve të tjera, u trajnuan nga OpenAI gjithashtu dhe mbi të gjitha mbi bazën e informacionit të mbledhur në internet përmes scraping: sot organizata shpjegon funksionimin e GPTBot, një crawler e ka vënë në dukje pikërisht këtë qëllim. Menaxherët e faqeve kanë një mënyrë për të përjashtuar faqet e tyre nga veprimi i agjentit, përmes skedarit robots.txt.
GPTBot është crawler i OpenAI për modelet GPT
Dokumentacioni zyrtar thotë se faqet e uebit të skanuara me agjentin GPTBot mund të përdoren potencialisht për të përmirësuar modelet e ardhshme dhe janë të filtruara për të hequr burimet që kërkojnë akses në mur, ato që përmbajnë informacion personalisht të identifikueshëm ose me tekst në kundërshtim me politikat tona. Aftësia e paqëllimshme për të anashkaluar muret e pagesës është ajo që çoi në bllokimin e Shfletuesit të ChatGPT me veçorinë Bing në fillim të korrikut.
Duke lejuar aksesin në burimet tuaja, ju i jepni një dorë OpenAI, duke ju lejuar t’i analizoni ato dhe ndoshta t’i përfshini në procesin e trajnimit të modelit GPT: Lejimi i aksesit të GPTBot në faqen tuaj mund të ndihmojë që modelet e AI të bëhen më të sakta dhe të përmirësojnë aftësitë dhe besimin e tyre të përgjithshëm .
Siç është shkruar në fillim, operacioni mund të parandalohet thjesht duke përfshirë sa vijon në skedarin robots.txt.
User-agent: GPTBot
Disallow: /
Në mënyrë të ngjashme, qasja selektive në directory mund të konfigurohet.
User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/
Kërkesat për GPTBot për faqet e internetit gjenerohen nga adresa IP specifike, të listuara në një listë të organizuar nga faqja OpenAI.
Pyetja më shumë se legjitime që shumë do t’i bëjnë vetes është: pse në tokë do të ishte e përshtatshme t’i lejohej crawler akses në burimet e veta? Në fund të fundit, shërbimet si ChatGPT që përdorin shabllone të arsimuara nuk drejtojnë trafikun (ndryshe, të themi, motorët e kërkimit) ose citojnë burimin e informacionit që u jepet përdoruesve. Herët a vonë, kërkesat e atyre që bëjnë pretendime për fitimin e parave të aktivitetit OpenAI të ndërtuar mbi bazën e informacionit të tyre do të duhet gjithashtu të merren parasysh.
Discussion about this post