01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Intel bashkohet me projektin “TeraFab” për çipa AI të Elon Musk

    Intel bashkohet me projektin “TeraFab” për çipa AI të Elon Musk

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

  • Aplikacione
    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    X po zgjerohet përtej feed-it me një “History” tab të ri

    X po zgjerohet përtej feed-it me një “History” tab të ri

    Prime Video sjell “feed”-in e videove të shkurtra në stil TikTok

    Prime Video sjell “feed”-in e videove të shkurtra në stil TikTok

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacionet më të mira të diktimit me AI në 2025

    Aplikacionet më të mira të diktimit me AI në 2025

  • Security
    Instructure përballet me hetim në SHBA pas incidenteve të sigurisë në Canvas

    Instructure përballet me hetim në SHBA pas incidenteve të sigurisë në Canvas

    SHBA dënon ish-ekzekutivin për transferim të teknologjisë kibernetike drejt Rusisë

    SHBA dënon ish-ekzekutivin për transferim të teknologjisë kibernetike drejt Rusisë

    Pse ndarja e një screenshot-i mund të të çojë në burg në Emiratet e Bashkuara Arabe

    Pse ndarja e një screenshot-i mund të të çojë në burg në Emiratet e Bashkuara Arabe

    Polonia paralajmëron për sulme kibernetike ndaj impianteve të ujit

    Polonia paralajmëron për sulme kibernetike ndaj impianteve të ujit

    Sulmi ndaj Canvas prek universitete dhe ngre alarm për të dhënat e studentëve

    Sulmi ndaj Canvas prek universitete dhe ngre alarm për të dhënat e studentëve

    “Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

    “Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Intel bashkohet me projektin “TeraFab” për çipa AI të Elon Musk

    Intel bashkohet me projektin “TeraFab” për çipa AI të Elon Musk

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

  • Aplikacione
    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    X po zgjerohet përtej feed-it me një “History” tab të ri

    X po zgjerohet përtej feed-it me një “History” tab të ri

    Prime Video sjell “feed”-in e videove të shkurtra në stil TikTok

    Prime Video sjell “feed”-in e videove të shkurtra në stil TikTok

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacionet më të mira të diktimit me AI në 2025

    Aplikacionet më të mira të diktimit me AI në 2025

  • Security
    Instructure përballet me hetim në SHBA pas incidenteve të sigurisë në Canvas

    Instructure përballet me hetim në SHBA pas incidenteve të sigurisë në Canvas

    SHBA dënon ish-ekzekutivin për transferim të teknologjisë kibernetike drejt Rusisë

    SHBA dënon ish-ekzekutivin për transferim të teknologjisë kibernetike drejt Rusisë

    Pse ndarja e një screenshot-i mund të të çojë në burg në Emiratet e Bashkuara Arabe

    Pse ndarja e një screenshot-i mund të të çojë në burg në Emiratet e Bashkuara Arabe

    Polonia paralajmëron për sulme kibernetike ndaj impianteve të ujit

    Polonia paralajmëron për sulme kibernetike ndaj impianteve të ujit

    Sulmi ndaj Canvas prek universitete dhe ngre alarm për të dhënat e studentëve

    Sulmi ndaj Canvas prek universitete dhe ngre alarm për të dhënat e studentëve

    “Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

    “Mythos” po ndryshon mënyrën si Firefox mbron veten nga sulmet kibernetike

No Result
View All Result
01News
No Result
View All Result
Home Të gjitha

OpenAI paraqet një qasje të re për sigurinë e AI

25/07/2024
in Të gjitha
Reading Time: 3 mins read
A A
OpenAI paraqet një qasje të re për sigurinë e AI
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

OpenAI ka zhvilluar Shpërblimet e Bazuara në Rregulla (RBR), një qasje e re për të përmirësuar sigurinë dhe efektivitetin e modeleve gjuhësore. Kjo metodë synon të harmonizojë sjelljen e AI me standardet e dëshiruara të sigurisë, duke përdorur vetë AI pa pasur nevojë për mbledhje të gjerë të të dhënave njerëzore.

Njoftimi i OpenAI vjen pas ricaktimit të Aleksander Madry, një prej drejtuesve kryesorë të sigurisë së AI. Ky veprim ka ngritur pikëpyetje në lidhje me prioritetet e sigurisë të kompanisë së udhëhequr nga Sam Altman, duke pasur parasysh rolin e spikatur të Madry. Kompania u përgjigj se Madry tani do të fokusohet në një projekt të fokusuar në përmirësimin e arsyetimit të modeleve të AI.

Dallimi midis RLHF dhe RBR
Tradicionalisht, të mësuarit e përforcimit të reagimeve njerëzore (RLHF) ka qenë metoda më e përdorur për të siguruar që modelet e gjuhës të ndjekin udhëzimet dhe t’u përmbahen udhëzimeve të sigurisë. Megjithatë, kërkimi OpenAI prezanton RBR-të si një alternativë më efikase dhe fleksibël. Shpërblimet e bazuara në rregulla përdorin një sërë rregullash të qarta dhe të graduara për të vlerësuar dhe drejtuar përgjigjet e modelit, duke siguruar që standardet e sigurisë janë përmbushur.

RBR-të janë krijuar për të zgjidhur problemet e përdorimit vetëm të reagimeve njerëzore, të cilat mund të jenë të shtrenjta, kërkojnë kohë dhe i nënshtrohen paragjykimeve. Duke zbërthyer sjelljet e dëshiruara në rregulla specifike, RBR-të sigurojnë kontroll të grimcuar mbi përgjigjet e modelit. Këto rregulla përdoren më pas për të trajnuar një “model shpërblimi” që drejton AI, duke sinjalizuar veprimet e dëshiruara dhe duke siguruar ndërveprime të sigurta dhe të respektueshme.

3 kategori sjelljesh
Tre kategoritë e sjelljeve të dëshiruara nga modeli kur kanë të bëjnë me tema të dëmshme ose të ndjeshme janë: Refuzimet e vështira, Refuzimet e buta dhe Përputhja. Refuzimet e rënda përfshijnë një falje të shkurtër dhe një deklaratë të paaftësisë për t’u përmbushur. Mbetjet e buta ofrojnë një përgjigje më të nuancuar.

Për shembull, nëse përdoruesi bën një kërkesë joetike si fyerja e një personi, modeli i AI mund të japë një përgjigje si: “Unë e kuptoj që mund të jesh i zemëruar, por fyerja e të tjerëve nuk është kurrë zgjidhja. Pse nuk përpiqemi të flasim në mënyrë konstruktive për atë që ju zemëroi?” Në këtë mënyrë modeli i AI refuzon butësisht kërkesën fillestare, por me ndjeshmëri dhe duke sugjeruar alternativa pozitive. Kategoria “Përputhje” kërkon që modeli të japë një përgjigje në përputhje me kërkesën e përdoruesit, duke respektuar ende udhëzimet e sigurisë.

Të mirat dhe të këqijat e Shpërblimeve të bazuara në rregulla OpenAI
Në eksperimente, modelet e trajnuara me RBR demonstruan performancë më të mirë sigurie sesa ato të trajnuara me reagime njerëzore, duke reduktuar gjithashtu rastet e refuzimit të gabuar të kërkesave të sigurta. RBR-të gjithashtu reduktojnë ndjeshëm nevojën për sasi të mëdha të të dhënave njerëzore, duke e bërë procesin e trajnimit më të shpejtë dhe më të lirë.

Megjithatë, ndërsa RBR-të funksionojnë mirë për detyra me rregulla të qarta, zbatimi i tyre në detyra më subjektive, si shkrimi i një eseje, mund të jetë sfidues. Megjithatë, kombinimi i RBR dhe reagimet njerëzore mund të balancojë këto sfida duke zbatuar udhëzime specifike dhe duke adresuar aspekte të nuancuara me kontributin njerëzor.

Tags: AIInteligjenca artificialeOpenAIsiguria

Të Lidhura

OpenAI po centralizon produktet rreth Greg Brockman mes një tjetër riorganizimi
Inteligjenca Artificiale

OpenAI po centralizon produktet rreth Greg Brockman mes një tjetër riorganizimi

18/05/2026
Siri i ri mund të sjellë fshirje automatike të bisedave
Apple

Siri i ri mund të sjellë fshirje automatike të bisedave

18/05/2026
Në epokën e AI-së, Gjenerata Z po ndryshon mënyrën si beson te e vërteta
Inteligjenca Artificiale

Në epokën e AI-së, Gjenerata Z po ndryshon mënyrën si beson te e vërteta

18/05/2026
Mira Murati po ndërton një AI që nuk synon të zëvendësojë njerëzit
Inteligjenca Artificiale

Mira Murati po ndërton një AI që nuk synon të zëvendësojë njerëzit

16/05/2026
RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global
Aplikacione

RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

16/05/2026
Beteja Musk kundër Altman mund të ndryshojë të ardhmen e OpenAI
Inteligjenca Artificiale

Beteja Musk kundër Altman mund të ndryshojë të ardhmen e OpenAI

16/05/2026
Next Post
Makinat më të shitura në Evropë në 2024: renditja

Makinat më të shitura në Evropë në 2024: renditja

Discussion about this post

SHKARKO ZERO1 APP

On Top.

OpenAI dhe Apple në përplasje të mundshme ligjore

OpenAI dhe Apple në përplasje të mundshme ligjore

15/05/2026
Gjyqi Musk–Altman po kthehet në një test për të ardhmen e industrisë së AI

Gjyqi Musk–Altman po kthehet në një test për të ardhmen e industrisë së AI

15/05/2026
Mira Murati po ndërton një AI që nuk synon të zëvendësojë njerëzit

Mira Murati po ndërton një AI që nuk synon të zëvendësojë njerëzit

16/05/2026
Beteja Musk kundër Altman mund të ndryshojë të ardhmen e OpenAI

Beteja Musk kundër Altman mund të ndryshojë të ardhmen e OpenAI

16/05/2026
OpenAI po centralizon produktet rreth Greg Brockman mes një tjetër riorganizimi

OpenAI po centralizon produktet rreth Greg Brockman mes një tjetër riorganizimi

18/05/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologji teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2026 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2026 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.