OpenAI: çfarë është crawler GPTBot dhe si ta bllokoni atë

08/08/2023

in Të gjitha

Reading Time: 2 mins read

Modelet e AI si ato gjuhësore të familjes GPT, në bazë të ChatGPT dhe shërbimeve të tjera, u trajnuan nga OpenAI gjithashtu dhe mbi të gjitha mbi bazën e informacionit të mbledhur në internet përmes scraping: sot organizata shpjegon funksionimin e GPTBot, një crawler e ka vënë në dukje pikërisht këtë qëllim. Menaxherët e faqeve kanë një mënyrë për të përjashtuar faqet e tyre nga veprimi i agjentit, përmes skedarit robots.txt.

GPTBot është crawler i OpenAI për modelet GPT
Dokumentacioni zyrtar thotë se faqet e uebit të skanuara me agjentin GPTBot mund të përdoren potencialisht për të përmirësuar modelet e ardhshme dhe janë të filtruara për të hequr burimet që kërkojnë akses në mur, ato që përmbajnë informacion personalisht të identifikueshëm ose me tekst në kundërshtim me politikat tona. Aftësia e paqëllimshme për të anashkaluar muret e pagesës është ajo që çoi në bllokimin e Shfletuesit të ChatGPT me veçorinë Bing në fillim të korrikut.

Duke lejuar aksesin në burimet tuaja, ju i jepni një dorë OpenAI, duke ju lejuar t’i analizoni ato dhe ndoshta t’i përfshini në procesin e trajnimit të modelit GPT: Lejimi i aksesit të GPTBot në faqen tuaj mund të ndihmojë që modelet e AI të bëhen më të sakta dhe të përmirësojnë aftësitë dhe besimin e tyre të përgjithshëm .

Siç është shkruar në fillim, operacioni mund të parandalohet thjesht duke përfshirë sa vijon në skedarin robots.txt.

User-agent: GPTBot
Disallow: /

Në mënyrë të ngjashme, qasja selektive në directory mund të konfigurohet.

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/

Kërkesat për GPTBot për faqet e internetit gjenerohen nga adresa IP specifike, të listuara në një listë të organizuar nga faqja OpenAI.

Pyetja më shumë se legjitime që shumë do t’i bëjnë vetes është: pse në tokë do të ishte e përshtatshme t’i lejohej crawler akses në burimet e veta? Në fund të fundit, shërbimet si ChatGPT që përdorin shabllone të arsimuara nuk drejtojnë trafikun (ndryshe, të themi, motorët e kërkimit) ose citojnë burimin e informacionit që u jepet përdoruesve. Herët a vonë, kërkesat e atyre që bëjnë pretendime për fitimin e parave të aktivitetit OpenAI të ndërtuar mbi bazën e informacionit të tyre do të duhet gjithashtu të merren parasysh.

Trending Tags

Trending Tags

OpenAI: çfarë është crawler GPTBot dhe si ta bllokoni atë

Të Lidhura

Discussion about this post

SHKARKO ZERO1 APP

On Top.

Kategoritë

Fjalët on TOP

Welcome Back!

Retrieve your password