01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Intel bashkohet me projektin “TeraFab” për çipa AI të Elon Musk

    Intel bashkohet me projektin “TeraFab” për çipa AI të Elon Musk

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

  • Aplikacione
    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacionet më të mira të diktimit me AI në 2025

    Aplikacionet më të mira të diktimit me AI në 2025

    Meta ndryshon rregullat e Instagram-it për të ulur dukshmërinë e “content aggregators”

    Meta ndryshon rregullat e Instagram-it për të ulur dukshmërinë e “content aggregators”

    YouTube teston kërkimin me AI që ofron përgjigje të drejtpërdrejta për përdoruesit

    YouTube teston kërkimin me AI që ofron përgjigje të drejtpërdrejta për përdoruesit

    Spotify hyn në tregun e fitness-it me përmbajtje stërvitjeje brenda aplikacionit

    Spotify hyn në tregun e fitness-it me përmbajtje stërvitjeje brenda aplikacionit

    Truecaller përballet me presion në rritje ndërsa zgjerimi i përdoruesve ngadalësohet

    Truecaller përballet me presion në rritje ndërsa zgjerimi i përdoruesve ngadalësohet

  • Security
    Polonia paralajmëron për sulme kibernetike ndaj impianteve të ujit

    Polonia paralajmëron për sulme kibernetike ndaj impianteve të ujit

    Sulmi ndaj Canvas prek universitete dhe ngre alarm për të dhënat e studentëve

    Sulmi ndaj Canvas prek universitete dhe ngre alarm për të dhënat e studentëve

    “Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

    “Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

    Hetimi amerikan lidh një grup ransomware me akses në databaza shtetërore ruse

    Hetimi amerikan lidh një grup ransomware me akses në databaza shtetërore ruse

    SHBA paralajmëron për sulme kibernetike ndaj sistemeve Linux në mbarë botën

    SHBA paralajmëron për sulme kibernetike ndaj sistemeve Linux në mbarë botën

    Një padi akuzon DHS se përdori Google për të gjurmuar kritikët ndaj ICE

    Një padi akuzon DHS se përdori Google për të gjurmuar kritikët ndaj ICE

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Intel bashkohet me projektin “TeraFab” për çipa AI të Elon Musk

    Intel bashkohet me projektin “TeraFab” për çipa AI të Elon Musk

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

  • Aplikacione
    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacionet më të mira të diktimit me AI në 2025

    Aplikacionet më të mira të diktimit me AI në 2025

    Meta ndryshon rregullat e Instagram-it për të ulur dukshmërinë e “content aggregators”

    Meta ndryshon rregullat e Instagram-it për të ulur dukshmërinë e “content aggregators”

    YouTube teston kërkimin me AI që ofron përgjigje të drejtpërdrejta për përdoruesit

    YouTube teston kërkimin me AI që ofron përgjigje të drejtpërdrejta për përdoruesit

    Spotify hyn në tregun e fitness-it me përmbajtje stërvitjeje brenda aplikacionit

    Spotify hyn në tregun e fitness-it me përmbajtje stërvitjeje brenda aplikacionit

    Truecaller përballet me presion në rritje ndërsa zgjerimi i përdoruesve ngadalësohet

    Truecaller përballet me presion në rritje ndërsa zgjerimi i përdoruesve ngadalësohet

  • Security
    Polonia paralajmëron për sulme kibernetike ndaj impianteve të ujit

    Polonia paralajmëron për sulme kibernetike ndaj impianteve të ujit

    Sulmi ndaj Canvas prek universitete dhe ngre alarm për të dhënat e studentëve

    Sulmi ndaj Canvas prek universitete dhe ngre alarm për të dhënat e studentëve

    “Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

    “Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

    Hetimi amerikan lidh një grup ransomware me akses në databaza shtetërore ruse

    Hetimi amerikan lidh një grup ransomware me akses në databaza shtetërore ruse

    SHBA paralajmëron për sulme kibernetike ndaj sistemeve Linux në mbarë botën

    SHBA paralajmëron për sulme kibernetike ndaj sistemeve Linux në mbarë botën

    Një padi akuzon DHS se përdori Google për të gjurmuar kritikët ndaj ICE

    Një padi akuzon DHS se përdori Google për të gjurmuar kritikët ndaj ICE

No Result
View All Result
01News
No Result
View All Result
Home Të gjitha

OpenAI paraqet një qasje të re për sigurinë e AI

25/07/2024
in Të gjitha
Reading Time: 3 mins read
A A
OpenAI paraqet një qasje të re për sigurinë e AI
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

OpenAI ka zhvilluar Shpërblimet e Bazuara në Rregulla (RBR), një qasje e re për të përmirësuar sigurinë dhe efektivitetin e modeleve gjuhësore. Kjo metodë synon të harmonizojë sjelljen e AI me standardet e dëshiruara të sigurisë, duke përdorur vetë AI pa pasur nevojë për mbledhje të gjerë të të dhënave njerëzore.

Njoftimi i OpenAI vjen pas ricaktimit të Aleksander Madry, një prej drejtuesve kryesorë të sigurisë së AI. Ky veprim ka ngritur pikëpyetje në lidhje me prioritetet e sigurisë të kompanisë së udhëhequr nga Sam Altman, duke pasur parasysh rolin e spikatur të Madry. Kompania u përgjigj se Madry tani do të fokusohet në një projekt të fokusuar në përmirësimin e arsyetimit të modeleve të AI.

Dallimi midis RLHF dhe RBR
Tradicionalisht, të mësuarit e përforcimit të reagimeve njerëzore (RLHF) ka qenë metoda më e përdorur për të siguruar që modelet e gjuhës të ndjekin udhëzimet dhe t’u përmbahen udhëzimeve të sigurisë. Megjithatë, kërkimi OpenAI prezanton RBR-të si një alternativë më efikase dhe fleksibël. Shpërblimet e bazuara në rregulla përdorin një sërë rregullash të qarta dhe të graduara për të vlerësuar dhe drejtuar përgjigjet e modelit, duke siguruar që standardet e sigurisë janë përmbushur.

RBR-të janë krijuar për të zgjidhur problemet e përdorimit vetëm të reagimeve njerëzore, të cilat mund të jenë të shtrenjta, kërkojnë kohë dhe i nënshtrohen paragjykimeve. Duke zbërthyer sjelljet e dëshiruara në rregulla specifike, RBR-të sigurojnë kontroll të grimcuar mbi përgjigjet e modelit. Këto rregulla përdoren më pas për të trajnuar një “model shpërblimi” që drejton AI, duke sinjalizuar veprimet e dëshiruara dhe duke siguruar ndërveprime të sigurta dhe të respektueshme.

3 kategori sjelljesh
Tre kategoritë e sjelljeve të dëshiruara nga modeli kur kanë të bëjnë me tema të dëmshme ose të ndjeshme janë: Refuzimet e vështira, Refuzimet e buta dhe Përputhja. Refuzimet e rënda përfshijnë një falje të shkurtër dhe një deklaratë të paaftësisë për t’u përmbushur. Mbetjet e buta ofrojnë një përgjigje më të nuancuar.

Për shembull, nëse përdoruesi bën një kërkesë joetike si fyerja e një personi, modeli i AI mund të japë një përgjigje si: “Unë e kuptoj që mund të jesh i zemëruar, por fyerja e të tjerëve nuk është kurrë zgjidhja. Pse nuk përpiqemi të flasim në mënyrë konstruktive për atë që ju zemëroi?” Në këtë mënyrë modeli i AI refuzon butësisht kërkesën fillestare, por me ndjeshmëri dhe duke sugjeruar alternativa pozitive. Kategoria “Përputhje” kërkon që modeli të japë një përgjigje në përputhje me kërkesën e përdoruesit, duke respektuar ende udhëzimet e sigurisë.

Të mirat dhe të këqijat e Shpërblimeve të bazuara në rregulla OpenAI
Në eksperimente, modelet e trajnuara me RBR demonstruan performancë më të mirë sigurie sesa ato të trajnuara me reagime njerëzore, duke reduktuar gjithashtu rastet e refuzimit të gabuar të kërkesave të sigurta. RBR-të gjithashtu reduktojnë ndjeshëm nevojën për sasi të mëdha të të dhënave njerëzore, duke e bërë procesin e trajnimit më të shpejtë dhe më të lirë.

Megjithatë, ndërsa RBR-të funksionojnë mirë për detyra me rregulla të qarta, zbatimi i tyre në detyra më subjektive, si shkrimi i një eseje, mund të jetë sfidues. Megjithatë, kombinimi i RBR dhe reagimet njerëzore mund të balancojë këto sfida duke zbatuar udhëzime specifike dhe duke adresuar aspekte të nuancuara me kontributin njerëzor.

Tags: AIInteligjenca artificialeOpenAIsiguria

Të Lidhura

Steyer propozon garanci pune për punonjësit e prekur nga AI në Kaliforni
Inteligjenca Artificiale

Steyer propozon garanci pune për punonjësit e prekur nga AI në Kaliforni

09/05/2026
Truecaller shkurton 70 vende pune mes rënies së tregut të reklamave
Kryesore

Truecaller shkurton 70 vende pune mes rënies së tregut të reklamave

09/05/2026
Padia e Elon Musk vendos praktikat e sigurisë së OpenAI nën lupë
Inteligjenca Artificiale

Padia e Elon Musk vendos praktikat e sigurisë së OpenAI nën lupë

08/05/2026
OpenAI prezanton modele të reja audio për aplikacione me inteligjencë artificiale
Inteligjenca Artificiale

OpenAI prezanton modele të reja audio për aplikacione me inteligjencë artificiale

08/05/2026
“Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike
Kryesore

“Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

08/05/2026
Prapaskenat e hershme të OpenAI: kur Musk kërkonte të sillte Altman në Tesla AI lab
Inteligjenca Artificiale

Prapaskenat e hershme të OpenAI: kur Musk kërkonte të sillte Altman në Tesla AI lab

07/05/2026
Next Post
Makinat më të shitura në Evropë në 2024: renditja

Makinat më të shitura në Evropë në 2024: renditja

Discussion about this post

SHKARKO ZERO1 APP

On Top.

Studiuesit prezantojnë OpenMythos, një model teorik AI me frymëzim nga Claude

Studiuesit prezantojnë OpenMythos, një model teorik AI me frymëzim nga Claude

05/05/2026
Studimi i Harvardit: AI tregoi saktësi më të lartë se disa mjekë të urgjencës

Studimi i Harvardit: AI tregoi saktësi më të lartë se disa mjekë të urgjencës

04/05/2026
Oscars përjashtojnë aktorët dhe skenarët e krijuar nga inteligjenca artificiale

Oscars përjashtojnë aktorët dhe skenarët e krijuar nga inteligjenca artificiale

04/05/2026
Barry Diller paralajmëron se besimi te liderët e AI nuk do të mjaftojë në epokën e AGI-së

Barry Diller paralajmëron se besimi te liderët e AI nuk do të mjaftojë në epokën e AGI-së

07/05/2026
a16z Crypto zgjeron bastin në blockchain me fond të ri prej 2.2 miliardë dollarësh

a16z Crypto zgjeron bastin në blockchain me fond të ri prej 2.2 miliardë dollarësh

06/05/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologji teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.