01News

Home
Review

Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

Intel Foundry: lajme të reja për teknologjinë e proceseve

Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?
Gaming

Roblox ndalohet në Rusi — platforma bllokohet për miliona përdorues pas vendimit të autoriteteve

Dhjetori i lojtarëve: Lançimet më të mëdha të videolojërave që mbyllin vitin 2025

Xbox Cloud Gaming falas dhe me reklama: Si do të funksionojë?

Nintendo sjell Virtual Boy pas 30 vitesh

PS5: Sony publikon detajet e para për fight stick

Microsoft prezanton verifikimin e moshës në Xbox në Mbretërinë e Bashkuar dhe vende të tjera
Paisje Tech
Samsung tërheq vëmendjen botërore: Galaxy Z TriFold, tableti 10-inç që paloset dhe futet në xhep

Sensorë të fshehtë në tualetet e shkollave amerikane – luftë ndaj vaping-ut apo ndaj privatësisë?

HP dhe Dell çaktivizojnë mbështetjen HEVC në disa laptopë, pavarësisht se procesorët e përkrahin

Laptopët e së Ardhmes: AI do të funksionojë direkt në pajisje, jo në cloud

Apple sjell personalizime të reja dhe alarme të zgjuara në iOS 26.2

Veir dhe Microsoft sjellin supermagnetet që transformojnë qendrat e të dhënave
Trending Tags
Kompiuter

Crucial mbyll një epokë 29-vjeçare: marka e njohur nuk do të shesë më RAM për përdoruesit

Çmimet e memorieve “ngjiten në qiell” — tani është periudha më e keqe për të ndërtuar një PC

HP dhe Dell çaktivizojnë mbështetjen HEVC në disa laptopë, pavarësisht se procesorët e përkrahin

Windows 11 sjell AI që punon në sfond, por rrezikon sigurinë e përdoruesve

Sensoret kuantike: Teknologjia që mat atë çfarë mendja njerëzore nuk e kap

Logitech K98M: Tastiera mekanike kompakte që po tërheq vëmendje
Aplikacione

Suport i bashkuar për Facebook dhe Instagram — Meta aktivizon një asistente AI

Telex i WordPress tregon potencial real: “vibe coding” po përdoret tashmë në faqe funksionale

Roblox ndalohet në Rusi — platforma bllokohet për miliona përdorues pas vendimit të autoriteteve

Fire TV tashmë gjen skenat e filmave vetëm me përshkrim zëri

Google godet fort: Gemini arrin 200 milion përdorues dhe detyron OpenAI të shpallë “alarm të kuq

Netflix heq funksionin “Cast” nga telefoni: përdoruesit tani detyrohen të shikojnë direkt nga TV-ja
Security

Predator nën akuzë: Intellexa mund të ketë aksesuar pajisje të përdoruesve pa miratim

Sulmi kibernetik ndaj Marquis zbulon cenueshmëri serioze në sistemet bankare amerikane

A mund të të heqin nga interneti për një film të shkarkuar? Gjykata e Lartë e SHBA-së po vendos tani

India vendos të regjistrojë çdo smartfon: çfarë do të thotë për përdoruesit dhe privatësinë

Sensorë të fshehtë në tualetet e shkollave amerikane – luftë ndaj vaping-ut apo ndaj privatësisë?

Konferenca e hakerëve që instaloi “antivirusin” më të çuditshëm: monitorim ajri në kohë reale

No Result

View All Result

No Result

View All Result

01News

No Result

View All Result

Home Të gjitha

Studim/AI-të po mësojnë gjithnjë e më shumë të gënjejnë dhe të mashtrojnë

in Të gjitha

Reading Time: 2 mins read

Studim/AI-të po mësojnë gjithnjë e më shumë të gënjejnë dhe të mashtrojnë

465

SHARES

1.5k

VIEWS

Share on Facebook Share on Twitter

Sistemet e inteligjencës artificiale po bëhen gjithnjë e më të aftë për të gënjyer dhe manipuluar, siç zbulojnë dy studime të fundit. Njëra e botuar këtë javë në revistën PNAS dhe tjetra muajin e kaluar në Patterns, ofrojnë gjetje tronditëse rreth modeleve të mëdha gjuhësore (LLM) dhe aftësisë së tyre për të gënjyer.

Në studimin në PNAS, etikasti gjerman i AI Thilo Hagendorff thotë se LLM-të e sofistikuara mund të inkurajohen të shfaqin sjellje “makiaveliste”, domethënë manipuluese dhe amorale të qëllimshme, të cilat mund të shkaktojnë sjellje mashtruese të gabuara. Hagendorff, një studiues në Universitetin e Shtutgartit, citon eksperimente që tregojnë se GPT-4, për shembull, shfaq sjellje mashtruese në 99.16% të rasteve gjatë skenarëve të thjeshtë të testimit.

Një studim tjetër, i udhëhequr nga studiuesi postdoktoral i Institutit të Teknologjisë në Massachusetts, Peter Park dhe i botuar në Patterns, shqyrtoi modelin Cicero të Meta-s, i njohur për aftësitë e tij në lojën strategjike politike “Diplomacia”. Ekipi hulumtues zbuloi se Ciceroni jo vetëm shkëlqen në mashtrim, por gjithashtu duket se përmirëson aftësinë e tij për të gënjyer sa më shumë që përdoret. Kjo sjellje u përshkrua si “manipulim i qartë” dhe jo një gabim aksidental.

Ndërsa Hagendorff vëren se problemi i mashtrimit nga LLM-të është i ndërlikuar nga paaftësia e AI për të pasur “qëllim” të ngjashëm me njeriun, studimi i Modeleve argumenton se, të paktën në kontekstin e lojës Diplomacia, Cicero duket se shkel premtimin e programuesve që nuk për të tradhtuar qëllimisht aleatët e tij të lojës.

Me fjalë të tjera, modeli përfshihet në mashtrime të paramenduara, prish marrëveshjet dhe thotë gënjeshtra të qarta. Siç shpjegoi Park në një deklaratë për shtyp: “Kemi zbuluar se inteligjenca artificiale e Metës është mësuar të jetë mjeshtër i mashtrimit”. Meta në një prononcim për New York Post theksoi se modelet e ndërtuara nga studiuesit e tyre janë trajnuar ekskluzivisht për lojëra.

Tags: AI ChatGPT gemini Inteligjenca artificiale studim

Të Lidhura

Fire TV tashmë gjen skenat e filmave vetëm me përshkrim zëri

Aplikacione

Fire TV tashmë gjen skenat e filmave vetëm me përshkrim zëri

Google godet fort: Gemini arrin 200 milion përdorues dhe detyron OpenAI të shpallë “alarm të kuq

Aplikacione

Google godet fort: Gemini arrin 200 milion përdorues dhe detyron OpenAI të shpallë “alarm të kuq

Amazon sfidon NVIDIA-n: çipi i ri i AI-së hap një epokë të re në garën teknologjike

Inteligjenca Artificiale

Amazon sfidon NVIDIA-n: çipi i ri i AI-së hap një epokë të re në garën teknologjike

Nvidia hap rrugën për makinat që vendosin vetë: modeli i ri i inteligjencës artificiale del publik

Inteligjenca Artificiale

Nvidia hap rrugën për makinat që vendosin vetë: modeli i ri i inteligjencës artificiale del publik

Google po ndërton avantazhin më të fuqishëm të AI-s me një armë të vjetër: gjithçka që di për ne

Inteligjenca Artificiale

Google po ndërton avantazhin më të fuqishëm të AI-s me një armë të vjetër: gjithçka që di për ne

Apple i beson inteligjencën artificiale një eksperti nga Google e Microsoft — nis “kapitulli i ri” me Amar Subramanya

Apple

Apple i beson inteligjencën artificiale një eksperti nga Google e Microsoft — nis “kapitulli i ri” me Amar Subramanya

Next Post

Në Kinë, AI merr kontrollin e ushtrisë: këta janë komandantët virtualë të PLA

Në Kinë, AI merr kontrollin e ushtrisë: këta janë komandantët virtualë të PLA

Discussion about this post

No Result

View All Result

© 2025 Zero1.al - Part of techzero1.com