01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Platforma Jest sfidon App Store: Luaj lojërat mobile direkt në biseda, pa shkarkime

    Platforma Jest sfidon App Store: Luaj lojërat mobile direkt në biseda, pa shkarkime

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

    Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

    Elon Musk planifikon prodhim të çipave për Tesla dhe SpaceX

    Elon Musk planifikon prodhim të çipave për Tesla dhe SpaceX

    Pajisjet AI që transkriptojnë takimet po krijojnë një kategori të re hardware

    Pajisjet AI që transkriptojnë takimet po krijojnë një kategori të re hardware

    Amazon zhvillon telefon të ri të fokusuar te Alexa dhe inteligjenca artificiale

    Amazon zhvillon telefon të ri të fokusuar te Alexa dhe inteligjenca artificiale

    Rrjetet që lidhin sistemet e AI-së po kthehen në biznesin e ri të madh të Nvidia-s

    Rrjetet që lidhin sistemet e AI-së po kthehen në biznesin e ri të madh të Nvidia-s

    Apple përditëson iPhone, iPad dhe Mac për të mbrojtur përdoruesit në Safari

    Apple përditëson iPhone, iPad dhe Mac për të mbrojtur përdoruesit në Safari

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

  • Aplikacione
    New Mexico: Meta pëson humbjen e parë në gjykatë për sigurinë e fëmijëve

    New Mexico: Meta pëson humbjen e parë në gjykatë për sigurinë e fëmijëve

    Flighty njofton në kohë reale për fluturimet dhe shqetësimet në aeroporte

    Flighty njofton në kohë reale për fluturimet dhe shqetësimet në aeroporte

    Pronari i OnlyFans, Leonid Radvinsky, ndërron jetë në moshën 43-vjeçare

    Pronari i OnlyFans, Leonid Radvinsky, ndërron jetë në moshën 43-vjeçare

    Rusia bllokon Archive.today: Rrit kontrollin mbi aksesin në përmbajtjen online

    Rusia bllokon Archive.today: Rrit kontrollin mbi aksesin në përmbajtjen online

    20 vjet nga tweet-i i parë: si Twitter ndryshoi komunikimin global

    20 vjet nga tweet-i i parë: si Twitter ndryshoi komunikimin global

    Meta rishikon vendimin dhe ruan Horizon Worlds në VR për përdoruesit ekzistues

    Meta rishikon vendimin dhe ruan Horizon Worlds në VR për përdoruesit ekzistues

  • Security
    Meta heq end-to-end encryption në Instagram, shqetësime për privatësinë

    Meta heq end-to-end encryption në Instagram, shqetësime për privatësinë

    Publikohet një sistem i avancuar që mund të komprometojë miliona iPhone

    Publikohet një sistem i avancuar që mund të komprometojë miliona iPhone

    FBI paralajmëron për hakerë iranianë që përdorin Telegram për vjedhjen e të dhënave

    FBI paralajmëron për hakerë iranianë që përdorin Telegram për vjedhjen e të dhënave

    SHBA akuzon Iranin për drejtimin e një grupi hakerësh pas sulmit ndaj Stryker

    SHBA akuzon Iranin për drejtimin e një grupi hakerësh pas sulmit ndaj Stryker

    Sulmi “DarkSword” kërcënon përdoruesit, Apple këshillon përditësimin e menjëhershëm të iOS

    Sulmi “DarkSword” kërcënon përdoruesit, Apple këshillon përditësimin e menjëhershëm të iOS

    Debat në Senat: FBI blen të dhëna vendndodhjeje, sfidë për të drejtat e qytetarëve

    Debat në Senat: FBI blen të dhëna vendndodhjeje, sfidë për të drejtat e qytetarëve

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Pokémon Pokopia Arrin Rekorde në Kritika dhe Komunitet, Një Spin‑Off Plot Kreativitet

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Nintendo padit Qeverinë e SHBA-së për rimbursim të tarifave të importit

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Google ul komisionet e Google Play Store në 20% pas marrëveshjes me Epic Games

    Platforma Jest sfidon App Store: Luaj lojërat mobile direkt në biseda, pa shkarkime

    Platforma Jest sfidon App Store: Luaj lojërat mobile direkt në biseda, pa shkarkime

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

    Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

    Elon Musk planifikon prodhim të çipave për Tesla dhe SpaceX

    Elon Musk planifikon prodhim të çipave për Tesla dhe SpaceX

    Pajisjet AI që transkriptojnë takimet po krijojnë një kategori të re hardware

    Pajisjet AI që transkriptojnë takimet po krijojnë një kategori të re hardware

    Amazon zhvillon telefon të ri të fokusuar te Alexa dhe inteligjenca artificiale

    Amazon zhvillon telefon të ri të fokusuar te Alexa dhe inteligjenca artificiale

    Rrjetet që lidhin sistemet e AI-së po kthehen në biznesin e ri të madh të Nvidia-s

    Rrjetet që lidhin sistemet e AI-së po kthehen në biznesin e ri të madh të Nvidia-s

    Apple përditëson iPhone, iPad dhe Mac për të mbrojtur përdoruesit në Safari

    Apple përditëson iPhone, iPad dhe Mac për të mbrojtur përdoruesit në Safari

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Eksperimenti që tregon fuqinë e AI-së: 16 agjentë Claude krijojnë softuer kompleks autonom

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Ligjvënësit e New Yorkut kërkojnë pauzë trevjeçare për qendrat e të dhënave

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

    Start-up kinez synon ndërfaqe tru–kompjuter pa implant, pa kirurgji dhe pa tela

  • Aplikacione
    New Mexico: Meta pëson humbjen e parë në gjykatë për sigurinë e fëmijëve

    New Mexico: Meta pëson humbjen e parë në gjykatë për sigurinë e fëmijëve

    Flighty njofton në kohë reale për fluturimet dhe shqetësimet në aeroporte

    Flighty njofton në kohë reale për fluturimet dhe shqetësimet në aeroporte

    Pronari i OnlyFans, Leonid Radvinsky, ndërron jetë në moshën 43-vjeçare

    Pronari i OnlyFans, Leonid Radvinsky, ndërron jetë në moshën 43-vjeçare

    Rusia bllokon Archive.today: Rrit kontrollin mbi aksesin në përmbajtjen online

    Rusia bllokon Archive.today: Rrit kontrollin mbi aksesin në përmbajtjen online

    20 vjet nga tweet-i i parë: si Twitter ndryshoi komunikimin global

    20 vjet nga tweet-i i parë: si Twitter ndryshoi komunikimin global

    Meta rishikon vendimin dhe ruan Horizon Worlds në VR për përdoruesit ekzistues

    Meta rishikon vendimin dhe ruan Horizon Worlds në VR për përdoruesit ekzistues

  • Security
    Meta heq end-to-end encryption në Instagram, shqetësime për privatësinë

    Meta heq end-to-end encryption në Instagram, shqetësime për privatësinë

    Publikohet një sistem i avancuar që mund të komprometojë miliona iPhone

    Publikohet një sistem i avancuar që mund të komprometojë miliona iPhone

    FBI paralajmëron për hakerë iranianë që përdorin Telegram për vjedhjen e të dhënave

    FBI paralajmëron për hakerë iranianë që përdorin Telegram për vjedhjen e të dhënave

    SHBA akuzon Iranin për drejtimin e një grupi hakerësh pas sulmit ndaj Stryker

    SHBA akuzon Iranin për drejtimin e një grupi hakerësh pas sulmit ndaj Stryker

    Sulmi “DarkSword” kërcënon përdoruesit, Apple këshillon përditësimin e menjëhershëm të iOS

    Sulmi “DarkSword” kërcënon përdoruesit, Apple këshillon përditësimin e menjëhershëm të iOS

    Debat në Senat: FBI blen të dhëna vendndodhjeje, sfidë për të drejtat e qytetarëve

    Debat në Senat: FBI blen të dhëna vendndodhjeje, sfidë për të drejtat e qytetarëve

No Result
View All Result
01News
No Result
View All Result
Home Të gjitha

OpenAI paraqet një qasje të re për sigurinë e AI

25/07/2024
in Të gjitha
Reading Time: 3 mins read
A A
OpenAI paraqet një qasje të re për sigurinë e AI
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

OpenAI ka zhvilluar Shpërblimet e Bazuara në Rregulla (RBR), një qasje e re për të përmirësuar sigurinë dhe efektivitetin e modeleve gjuhësore. Kjo metodë synon të harmonizojë sjelljen e AI me standardet e dëshiruara të sigurisë, duke përdorur vetë AI pa pasur nevojë për mbledhje të gjerë të të dhënave njerëzore.

Njoftimi i OpenAI vjen pas ricaktimit të Aleksander Madry, një prej drejtuesve kryesorë të sigurisë së AI. Ky veprim ka ngritur pikëpyetje në lidhje me prioritetet e sigurisë të kompanisë së udhëhequr nga Sam Altman, duke pasur parasysh rolin e spikatur të Madry. Kompania u përgjigj se Madry tani do të fokusohet në një projekt të fokusuar në përmirësimin e arsyetimit të modeleve të AI.

Dallimi midis RLHF dhe RBR
Tradicionalisht, të mësuarit e përforcimit të reagimeve njerëzore (RLHF) ka qenë metoda më e përdorur për të siguruar që modelet e gjuhës të ndjekin udhëzimet dhe t’u përmbahen udhëzimeve të sigurisë. Megjithatë, kërkimi OpenAI prezanton RBR-të si një alternativë më efikase dhe fleksibël. Shpërblimet e bazuara në rregulla përdorin një sërë rregullash të qarta dhe të graduara për të vlerësuar dhe drejtuar përgjigjet e modelit, duke siguruar që standardet e sigurisë janë përmbushur.

RBR-të janë krijuar për të zgjidhur problemet e përdorimit vetëm të reagimeve njerëzore, të cilat mund të jenë të shtrenjta, kërkojnë kohë dhe i nënshtrohen paragjykimeve. Duke zbërthyer sjelljet e dëshiruara në rregulla specifike, RBR-të sigurojnë kontroll të grimcuar mbi përgjigjet e modelit. Këto rregulla përdoren më pas për të trajnuar një “model shpërblimi” që drejton AI, duke sinjalizuar veprimet e dëshiruara dhe duke siguruar ndërveprime të sigurta dhe të respektueshme.

3 kategori sjelljesh
Tre kategoritë e sjelljeve të dëshiruara nga modeli kur kanë të bëjnë me tema të dëmshme ose të ndjeshme janë: Refuzimet e vështira, Refuzimet e buta dhe Përputhja. Refuzimet e rënda përfshijnë një falje të shkurtër dhe një deklaratë të paaftësisë për t’u përmbushur. Mbetjet e buta ofrojnë një përgjigje më të nuancuar.

Për shembull, nëse përdoruesi bën një kërkesë joetike si fyerja e një personi, modeli i AI mund të japë një përgjigje si: “Unë e kuptoj që mund të jesh i zemëruar, por fyerja e të tjerëve nuk është kurrë zgjidhja. Pse nuk përpiqemi të flasim në mënyrë konstruktive për atë që ju zemëroi?” Në këtë mënyrë modeli i AI refuzon butësisht kërkesën fillestare, por me ndjeshmëri dhe duke sugjeruar alternativa pozitive. Kategoria “Përputhje” kërkon që modeli të japë një përgjigje në përputhje me kërkesën e përdoruesit, duke respektuar ende udhëzimet e sigurisë.

Të mirat dhe të këqijat e Shpërblimeve të bazuara në rregulla OpenAI
Në eksperimente, modelet e trajnuara me RBR demonstruan performancë më të mirë sigurie sesa ato të trajnuara me reagime njerëzore, duke reduktuar gjithashtu rastet e refuzimit të gabuar të kërkesave të sigurta. RBR-të gjithashtu reduktojnë ndjeshëm nevojën për sasi të mëdha të të dhënave njerëzore, duke e bërë procesin e trajnimit më të shpejtë dhe më të lirë.

Megjithatë, ndërsa RBR-të funksionojnë mirë për detyra me rregulla të qarta, zbatimi i tyre në detyra më subjektive, si shkrimi i një eseje, mund të jetë sfidues. Megjithatë, kombinimi i RBR dhe reagimet njerëzore mund të balancojë këto sfida duke zbatuar udhëzime specifike dhe duke adresuar aspekte të nuancuara me kontributin njerëzor.

Tags: AIInteligjenca artificialeOpenAIsiguria

Të Lidhura

OpenAI mbyll Sora pas vetëm disa muajsh përdorimi
Inteligjenca Artificiale

OpenAI mbyll Sora pas vetëm disa muajsh përdorimi

25/03/2026
Planet e OpenAI për e-commerce në ChatGPT hasin vështirësi
Inteligjenca Artificiale

Planet e OpenAI për e-commerce në ChatGPT hasin vështirësi

25/03/2026
Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta
Kryesore

Pas 35 vitesh dizajni, Arm Holdings nis prodhimin e çipeve të veta

25/03/2026
Agile Robots bashkëpunon me Google DeepMind, rritet integrimi i AI në robotikë
Inteligjenca Artificiale

Agile Robots bashkëpunon me Google DeepMind, rritet integrimi i AI në robotikë

24/03/2026
Pentagon vs. Anthropic: Senatorja Warren kundërshton vendimin e Pentagonit
Inteligjenca Artificiale

Pentagon vs. Anthropic: Senatorja Warren kundërshton vendimin e Pentagonit

24/03/2026
Apple shpall WWDC 2026: Fokus te AI dhe një Siri i ri-dizajnuar
Apple

Apple shpall WWDC 2026: Fokus te AI dhe një Siri i ri-dizajnuar

24/03/2026
Next Post
Makinat më të shitura në Evropë në 2024: renditja

Makinat më të shitura në Evropë në 2024: renditja

Discussion about this post

SHKARKO ZERO1 APP

On Top.

Claude Code bëhet më i fuqishëm, por Anthropic vendos kufij sigurie

Claude Code bëhet më i fuqishëm, por Anthropic vendos kufij sigurie

25/03/2026
Investimi më i zgjuar në AI mund të mos jetë teknologjia, por energjia që e fuqizon

Investimi më i zgjuar në AI mund të mos jetë teknologjia, por energjia që e fuqizon

21/03/2026
Amazon investon në robotikë për shtëpi, blen startup-in e robotëve humanoidë të vegjël

Amazon investon në robotikë për shtëpi, blen startup-in e robotëve humanoidë të vegjël

25/03/2026
Fondet pensionale australiane shqyrtojnë investimet në kriptovaluta

Fondet pensionale australiane shqyrtojnë investimet në kriptovaluta

24/03/2026
Pentagoni e ka shpallur Anthropic një “rrezik të papranueshëm për sigurinë kombëtare”.

Pentagoni e ka shpallur Anthropic një “rrezik të papranueshëm për sigurinë kombëtare”.

19/03/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple bateria Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.