01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Trump Mobile nën vëzhgim pas pretendimeve për ekspozimin e informacionit të klientëve

    Trump Mobile nën vëzhgim pas pretendimeve për ekspozimin e informacionit të klientëve

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

  • Aplikacione
    Discord aktivizon enkriptimin “end-to-end” për të gjitha thirrjet audio dhe video

    Discord aktivizon enkriptimin “end-to-end” për të gjitha thirrjet audio dhe video

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    X po zgjerohet përtej feed-it me një “History” tab të ri

    X po zgjerohet përtej feed-it me një “History” tab të ri

    Prime Video sjell “feed”-in e videove të shkurtra në stil TikTok

    Prime Video sjell “feed”-in e videove të shkurtra në stil TikTok

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

  • Security
    Google dhe CrowdStrike çmontojnë botnet-in Glassworm që synonte zhvilluesit e softuerëve

    Google dhe CrowdStrike çmontojnë botnet-in Glassworm që synonte zhvilluesit e softuerëve

    Portali britanik i vizave ekspozoi online mijëra pasaporta dhe foto personale

    Portali britanik i vizave ekspozoi online mijëra pasaporta dhe foto personale

    Siguria kibernetike futet në një cikël të ri përshpejtimi nga përdorimi i AI-së

    Siguria kibernetike futet në një cikël të ri përshpejtimi nga përdorimi i AI-së

    Nga sulme digjitale në mbrojtje: Ocean synon të ndalë phishing-un me AI

    Nga sulme digjitale në mbrojtje: Ocean synon të ndalë phishing-un me AI

    Sulmi ndaj sistemit shëndetësor në New York preku 1.8 milionë njerëz

    Sulmi ndaj sistemit shëndetësor në New York preku 1.8 milionë njerëz

    Instructure përballet me hetim në SHBA pas incidenteve të sigurisë në Canvas

    Instructure përballet me hetim në SHBA pas incidenteve të sigurisë në Canvas

No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

  • Gaming
    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Padi ndaj Nintendo-s: konsumatorët kërkojnë dëmshpërblim nga rimbursimet e tarifave

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Roblox forcon sigurinë për fëmijët me llogari të reja “Kids” dhe “Select”

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Netflix prezanton “Playground”, aplikacionin e lojërave për fëmijë

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Nintendo Switch 2: Versioni i ri i Super Mario Bros. Wonder kombinon nostalgjinë me inovacionin

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Senatorja Warren paralajmëron MrBeast për kriptovalutat tek fëmijët

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

    Kur inteligjenca artificiale bën “cheat”: si AI po transformon lojërat që njohim

  • Paisje Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Smartphone
    Trump Mobile nën vëzhgim pas pretendimeve për ekspozimin e informacionit të klientëve

    Trump Mobile nën vëzhgim pas pretendimeve për ekspozimin e informacionit të klientëve

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Tesla çon shpenzimet në 25 miliardë dollarë, fokus në AI dhe robotaksi

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Britania e Madhe: rreth 100 vende kanë akses në spyware që mund të hakojë telefonat celularë

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Gjysmëmaratona e Pekinit: robotët tejkalojnë performancën njerëzore

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Mbi 70 organizata kundërshtojnë teknologjinë e njohjes së fytyrës në syzet e Meta-s

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Apple dhe Lenovo në fund të listës për riparueshmërinë e pajisjeve

    Trending Tags

    • Best iPhone 7 deals
    • Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    Franca kalon në Linux për të reduktuar varësinë nga teknologjia amerikane

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    IPVanish zgjeron mbrojtjen: antivirus në kohë reale edhe pa VPN aktive

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Siguria dixhitale nën kërcënim: fuqia kuantike mund të thyejë kriptografinë aktuale

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Sierra zëvendësohet nga El Capitan: pse superkompjuteri legjendar u tërhoq?

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Marrëveshja Nvidia–Meta sinjalizon një epokë të re në fuqinë përpunuese të inteligjencës artificiale

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

    Universitetet përballen me rënie në shkencat kompjuterike: studentët drejt fushave të reja

  • Aplikacione
    Discord aktivizon enkriptimin “end-to-end” për të gjitha thirrjet audio dhe video

    Discord aktivizon enkriptimin “end-to-end” për të gjitha thirrjet audio dhe video

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    RedNote, aplikacioni kinez po sfidon Instagramin në turizmin global

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    “Instants” sjell në Instagram elemente nga Snapchat dhe BeReal

    X po zgjerohet përtej feed-it me një “History” tab të ri

    X po zgjerohet përtej feed-it me një “History” tab të ri

    Prime Video sjell “feed”-in e videove të shkurtra në stil TikTok

    Prime Video sjell “feed”-in e videove të shkurtra në stil TikTok

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

    Aplikacioni Bumble largohet nga “swipe” në një ndryshim të madh produkti

  • Security
    Google dhe CrowdStrike çmontojnë botnet-in Glassworm që synonte zhvilluesit e softuerëve

    Google dhe CrowdStrike çmontojnë botnet-in Glassworm që synonte zhvilluesit e softuerëve

    Portali britanik i vizave ekspozoi online mijëra pasaporta dhe foto personale

    Portali britanik i vizave ekspozoi online mijëra pasaporta dhe foto personale

    Siguria kibernetike futet në një cikël të ri përshpejtimi nga përdorimi i AI-së

    Siguria kibernetike futet në një cikël të ri përshpejtimi nga përdorimi i AI-së

    Nga sulme digjitale në mbrojtje: Ocean synon të ndalë phishing-un me AI

    Nga sulme digjitale në mbrojtje: Ocean synon të ndalë phishing-un me AI

    Sulmi ndaj sistemit shëndetësor në New York preku 1.8 milionë njerëz

    Sulmi ndaj sistemit shëndetësor në New York preku 1.8 milionë njerëz

    Instructure përballet me hetim në SHBA pas incidenteve të sigurisë në Canvas

    Instructure përballet me hetim në SHBA pas incidenteve të sigurisë në Canvas

No Result
View All Result
01News
No Result
View All Result
Home Të gjitha

OpenAI paraqet një qasje të re për sigurinë e AI

25/07/2024
in Të gjitha
Reading Time: 3 mins read
A A
OpenAI paraqet një qasje të re për sigurinë e AI
465
SHARES
1.5k
VIEWS
Share on FacebookShare on Twitter

OpenAI ka zhvilluar Shpërblimet e Bazuara në Rregulla (RBR), një qasje e re për të përmirësuar sigurinë dhe efektivitetin e modeleve gjuhësore. Kjo metodë synon të harmonizojë sjelljen e AI me standardet e dëshiruara të sigurisë, duke përdorur vetë AI pa pasur nevojë për mbledhje të gjerë të të dhënave njerëzore.

Njoftimi i OpenAI vjen pas ricaktimit të Aleksander Madry, një prej drejtuesve kryesorë të sigurisë së AI. Ky veprim ka ngritur pikëpyetje në lidhje me prioritetet e sigurisë të kompanisë së udhëhequr nga Sam Altman, duke pasur parasysh rolin e spikatur të Madry. Kompania u përgjigj se Madry tani do të fokusohet në një projekt të fokusuar në përmirësimin e arsyetimit të modeleve të AI.

Dallimi midis RLHF dhe RBR
Tradicionalisht, të mësuarit e përforcimit të reagimeve njerëzore (RLHF) ka qenë metoda më e përdorur për të siguruar që modelet e gjuhës të ndjekin udhëzimet dhe t’u përmbahen udhëzimeve të sigurisë. Megjithatë, kërkimi OpenAI prezanton RBR-të si një alternativë më efikase dhe fleksibël. Shpërblimet e bazuara në rregulla përdorin një sërë rregullash të qarta dhe të graduara për të vlerësuar dhe drejtuar përgjigjet e modelit, duke siguruar që standardet e sigurisë janë përmbushur.

RBR-të janë krijuar për të zgjidhur problemet e përdorimit vetëm të reagimeve njerëzore, të cilat mund të jenë të shtrenjta, kërkojnë kohë dhe i nënshtrohen paragjykimeve. Duke zbërthyer sjelljet e dëshiruara në rregulla specifike, RBR-të sigurojnë kontroll të grimcuar mbi përgjigjet e modelit. Këto rregulla përdoren më pas për të trajnuar një “model shpërblimi” që drejton AI, duke sinjalizuar veprimet e dëshiruara dhe duke siguruar ndërveprime të sigurta dhe të respektueshme.

3 kategori sjelljesh
Tre kategoritë e sjelljeve të dëshiruara nga modeli kur kanë të bëjnë me tema të dëmshme ose të ndjeshme janë: Refuzimet e vështira, Refuzimet e buta dhe Përputhja. Refuzimet e rënda përfshijnë një falje të shkurtër dhe një deklaratë të paaftësisë për t’u përmbushur. Mbetjet e buta ofrojnë një përgjigje më të nuancuar.

Për shembull, nëse përdoruesi bën një kërkesë joetike si fyerja e një personi, modeli i AI mund të japë një përgjigje si: “Unë e kuptoj që mund të jesh i zemëruar, por fyerja e të tjerëve nuk është kurrë zgjidhja. Pse nuk përpiqemi të flasim në mënyrë konstruktive për atë që ju zemëroi?” Në këtë mënyrë modeli i AI refuzon butësisht kërkesën fillestare, por me ndjeshmëri dhe duke sugjeruar alternativa pozitive. Kategoria “Përputhje” kërkon që modeli të japë një përgjigje në përputhje me kërkesën e përdoruesit, duke respektuar ende udhëzimet e sigurisë.

Të mirat dhe të këqijat e Shpërblimeve të bazuara në rregulla OpenAI
Në eksperimente, modelet e trajnuara me RBR demonstruan performancë më të mirë sigurie sesa ato të trajnuara me reagime njerëzore, duke reduktuar gjithashtu rastet e refuzimit të gabuar të kërkesave të sigurta. RBR-të gjithashtu reduktojnë ndjeshëm nevojën për sasi të mëdha të të dhënave njerëzore, duke e bërë procesin e trajnimit më të shpejtë dhe më të lirë.

Megjithatë, ndërsa RBR-të funksionojnë mirë për detyra me rregulla të qarta, zbatimi i tyre në detyra më subjektive, si shkrimi i një eseje, mund të jetë sfidues. Megjithatë, kombinimi i RBR dhe reagimet njerëzore mund të balancojë këto sfida duke zbatuar udhëzime specifike dhe duke adresuar aspekte të nuancuara me kontributin njerëzor.

Tags: AIInteligjenca artificialeOpenAIsiguria

Të Lidhura

Epoka e AI-së po ndryshon mënyrën se si funksionon interneti
Inteligjenca Artificiale

Epoka e AI-së po ndryshon mënyrën se si funksionon interneti

29/05/2026
Tokenët e inteligjencës artificiale mund të bëhen loja e re e madhe financiare
Kryesore

Tokenët e inteligjencës artificiale mund të bëhen loja e re e madhe financiare

29/05/2026
Ndërsa rivaliteti me SHBA intensifikohet, Kina po kufizon largimin e ekspertëve të AI-së
Inteligjenca Artificiale

Ndërsa rivaliteti me SHBA intensifikohet, Kina po kufizon largimin e ekspertëve të AI-së

28/05/2026
Meta po vendos abonime me pagesë në Facebook, Instagram dhe WhatsApp
Kryesore

Meta po vendos abonime me pagesë në Facebook, Instagram dhe WhatsApp

28/05/2026
Telefonata nga mbledhësit e borxheve? Tani mund të jenë nga një AI
Inteligjenca Artificiale

Telefonata nga mbledhësit e borxheve? Tani mund të jenë nga një AI

26/05/2026
Pse laboratorët më të mëdhenj të AI-së po punësojnë filozofë në vend të programuesve të tjerë
Inteligjenca Artificiale

Pse laboratorët më të mëdhenj të AI-së po punësojnë filozofë në vend të programuesve të tjerë

26/05/2026
Next Post
Makinat më të shitura në Evropë në 2024: renditja

Makinat më të shitura në Evropë në 2024: renditja

Discussion about this post

SHKARKO ZERO1 APP

On Top.

Sipas Google, gara për AI po avancon më shpejt se masat e sigurisë

Sipas Google, gara për AI po avancon më shpejt se masat e sigurisë

25/05/2026
Meta po vendos abonime me pagesë në Facebook, Instagram dhe WhatsApp

Meta po vendos abonime me pagesë në Facebook, Instagram dhe WhatsApp

28/05/2026
Pse laboratorët më të mëdhenj të AI-së po punësojnë filozofë në vend të programuesve të tjerë

Pse laboratorët më të mëdhenj të AI-së po punësojnë filozofë në vend të programuesve të tjerë

26/05/2026
Pse AI-ja e Google nuk arrin të gërmëzojë saktë as fjalën “Google”

Pse AI-ja e Google nuk arrin të gërmëzojë saktë as fjalën “Google”

28/05/2026
Tokenët e inteligjencës artificiale mund të bëhen loja e re e madhe financiare

Tokenët e inteligjencës artificiale mund të bëhen loja e re e madhe financiare

29/05/2026
01News

Lajmet e fundit nga teknologjia rreth kompanive me te mira (më e keqe) hardware, aplikacione, dhe shumë më tepër. Nga kompani si google , apple e deri te ato startupet e vogla që po kërkojnë vëmendjen tuaj . 01News do ketë te fundit ne teknologji .

Na ndiq

Kategoritë

  • Aplikacione
  • Apple
  • Audio
  • Auto
  • Beyond Code Podcast
  • Bota e Kriptos
  • Camera
  • Gaming
  • Inteligjenca Artificiale
  • Kompiuter
  • Kryesore
  • Laptop
  • Paisje Tech
  • Review
  • Security
  • Smartphone
  • Të gjitha
GACOR4D
TOTO4D
SLOT4D

Fjalët on TOP

AI Android aplikacion aplikacione apple Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google haker Instagram Inteligjenca artificiale inteligjence artificiale iOS iPhone kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privatësia përdorues rusia samsung SHBA siguria smartphone sulm kibernetik te dhena teknologji teknologjia TikTok twitter vecori Video WhatsApp x youtube
  • Rreth Nesh
  • Reklamo
  • Privacy & Policy
  • Kontakt

© 2026 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Paisje Tech
  • Kompiuter
  • Aplikacione
  • Security

© 2026 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.