01News
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    The dependence of the camp: To the people spend 6 hours a day. 62% of the use, between the ages of 3 and 5 years of age

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defect of the CrowdStrike, has caused great damage: out of the reach of assessments first

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: the GPU has, the smartfonit Samsung is the most powerful?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    The Samsung Galaxy Z Flip 5, the first test of the resistance line which online: is it better than the Flip 4?

  • Gaming
    Tre ish-drejtues të Ubisoft dënohen për ngacmim seksual dhe dhunë psikologjike

    Tre ish-drejtues të Ubisoft dënohen për ngacmim seksual dhe dhunë psikologjike

    A e keni këtë model të PS5? Metali i lëngshëm mund ta dëmtojë atë në mënyrë të pariparueshme

    A e keni këtë model të PS5? Metali i lëngshëm mund ta dëmtojë atë në mënyrë të pariparueshme

    Microsoft prezanton Quest 3S Xbox Edition

    Microsoft prezanton Quest 3S Xbox Edition

    Realiteti Virtual në Xbox: E vetmja gjë që mungon është njoftimi

    Realiteti Virtual në Xbox: E vetmja gjë që mungon është njoftimi

    Mod fake të Minecraft vjedhin të dhënat e lojtarëve

    Mod fake të Minecraft vjedhin të dhënat e lojtarëve

    OnePlus dëshiron të lançojë një tablet për gaming

    OnePlus dëshiron të lançojë një tablet për gaming

  • Tool Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Phone
    Samsung zbulon Galaxy Watch 8: smartwatch që ripërcakton mirëqenien

    Samsung zbulon Galaxy Watch 8: smartwatch që ripërcakton mirëqenien

    Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

    Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

    Samsung zbulon Galaxy Z Fold7: një pajisje e palosshme e hollë dhe e fuqishme

    Samsung zbulon Galaxy Z Fold7: një pajisje e palosshme e hollë dhe e fuqishme

    Rritje disproporcionale e çmimeve? Përdoruesit u thonë ‘Jo’ orëve Samsung Galaxy

    Rritje disproporcionale e çmimeve? Përdoruesit u thonë ‘Jo’ orëve Samsung Galaxy

    Edhe Xiaomi do të ketë Liquid Glass: pamjet e dizajnit të ri të HyperOS 3

    Edhe Xiaomi do të ketë Liquid Glass: pamjet e dizajnit të ri të HyperOS 3

    Honor Magic Pad 3: Tablet i ri 13 inç

    Honor Magic Pad 3: Tablet i ri 13 inç

    Trending Tags

    • The Best iPhone 7 deals
    • The Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • The Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Windows 11 tejkalon Windows 10 pas katër vitesh

    Windows 11 tejkalon Windows 10 pas katër vitesh

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

  • Applications
    Threads është gati ta mposhtë X-in, një hap larg tejkalimit

    Threads është gati ta mposhtë X-in, një hap larg tejkalimit

    Dy vjet pas lançimit, mesazhet direkte vijnë në Threads

    Dy vjet pas lançimit, mesazhet direkte vijnë në Threads

    Meta Verified nuk funksionon: Përdoruesit paguajnë, por askush nuk i ndihmon

    Meta Verified nuk funksionon: Përdoruesit paguajnë, por askush nuk i ndihmon

    WhatsApp transformohet: A do të jetë skanimi i dokumenteve veçoria e radhës?

    WhatsApp transformohet: A do të jetë skanimi i dokumenteve veçoria e radhës?

    CapCut i merr videot tuaja përgjithmonë (edhe nëse i fshini)

    CapCut i merr videot tuaja përgjithmonë (edhe nëse i fshini)

    Nga 1 korriku 2025, WhatsApp do të ndalojë së funksionuari në këto smartphone: lista

    Nga 1 korriku 2025, WhatsApp do të ndalojë së funksionuari në këto smartphone: lista

  • Security
    Catwatchful: data breach  zbulon mbikëqyrjen masive

    Catwatchful: data breach zbulon mbikëqyrjen masive

    Hakohen në Australi të dhënat e 6 milionë pasagjerëve të Qantas

    Hakohen në Australi të dhënat e 6 milionë pasagjerëve të Qantas

    Llogaritë e rreme në Instagram: Epoka e re e mashtrimeve

    Llogaritë e rreme në Instagram: Epoka e re e mashtrimeve

    Karteli i Sinaloas spiunon një smartphone të FBI-së

    Karteli i Sinaloas spiunon një smartphone të FBI-së

    Një bug i bëri mijëra norvegjezë të besonin se ishin bërë të pasur, por…

    Një bug i bëri mijëra norvegjezë të besonin se ishin bërë të pasur, por…

    Gjermania gjithashtu ndalon Deepseek-un

    Gjermania gjithashtu ndalon Deepseek-un

  • sqAlbanian
No Result
View All Result
  • Home
  • Review
    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Nga viti 2005 deri më sot: këto janë videot që bënë histori në YouTube sipas shikimeve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Intel Foundry: lajme të reja për teknologjinë e proceseve

    Varësia nga smartphone: Të rinjtë i kalojnë 6 orë në ditë. 62% e përdorin midis moshës 3 dhe 5 vjeç

    The dependence of the camp: To the people spend 6 hours a day. 62% of the use, between the ages of 3 and 5 years of age

    Defekti i CrowdStrike ka shkaktuar dëme të mëdha: mbërrijnë vlerësimet e para

    Defect of the CrowdStrike, has caused great damage: out of the reach of assessments first

    Galaxy S23 Ultra vs iPhone 15 Pro Max: a është GPU-ja e smartfonit Samsung më e fuqishme?

    Galaxy S23 Ultra vs iPhone 15 Pro Max: the GPU has, the smartfonit Samsung is the most powerful?

    Samsung Galaxy Z Flip 5, testi i parë i rezistencës online: a është më i mirë se Flip 4?

    The Samsung Galaxy Z Flip 5, the first test of the resistance line which online: is it better than the Flip 4?

  • Gaming
    Tre ish-drejtues të Ubisoft dënohen për ngacmim seksual dhe dhunë psikologjike

    Tre ish-drejtues të Ubisoft dënohen për ngacmim seksual dhe dhunë psikologjike

    A e keni këtë model të PS5? Metali i lëngshëm mund ta dëmtojë atë në mënyrë të pariparueshme

    A e keni këtë model të PS5? Metali i lëngshëm mund ta dëmtojë atë në mënyrë të pariparueshme

    Microsoft prezanton Quest 3S Xbox Edition

    Microsoft prezanton Quest 3S Xbox Edition

    Realiteti Virtual në Xbox: E vetmja gjë që mungon është njoftimi

    Realiteti Virtual në Xbox: E vetmja gjë që mungon është njoftimi

    Mod fake të Minecraft vjedhin të dhënat e lojtarëve

    Mod fake të Minecraft vjedhin të dhënat e lojtarëve

    OnePlus dëshiron të lançojë një tablet për gaming

    OnePlus dëshiron të lançojë një tablet për gaming

  • Tool Tech
    • All
    • Audio
    • Camera
    • Laptop
    • Phone
    Samsung zbulon Galaxy Watch 8: smartwatch që ripërcakton mirëqenien

    Samsung zbulon Galaxy Watch 8: smartwatch që ripërcakton mirëqenien

    Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

    Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

    Samsung zbulon Galaxy Z Fold7: një pajisje e palosshme e hollë dhe e fuqishme

    Samsung zbulon Galaxy Z Fold7: një pajisje e palosshme e hollë dhe e fuqishme

    Rritje disproporcionale e çmimeve? Përdoruesit u thonë ‘Jo’ orëve Samsung Galaxy

    Rritje disproporcionale e çmimeve? Përdoruesit u thonë ‘Jo’ orëve Samsung Galaxy

    Edhe Xiaomi do të ketë Liquid Glass: pamjet e dizajnit të ri të HyperOS 3

    Edhe Xiaomi do të ketë Liquid Glass: pamjet e dizajnit të ri të HyperOS 3

    Honor Magic Pad 3: Tablet i ri 13 inç

    Honor Magic Pad 3: Tablet i ri 13 inç

    Trending Tags

    • The Best iPhone 7 deals
    • The Apple Watch 2
    • Nintendo Switch
    • CES 2017
    • The Playstation 4 Pro
    • iOS 10
    • iPhone 7
    • Sillicon Valley
  • Kompiuter
    Windows 11 tejkalon Windows 10 pas katër vitesh

    Windows 11 tejkalon Windows 10 pas katër vitesh

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Rocky Linux 10 lëshohet zyrtarisht: Lajmet e reja

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Colossus 2, superkompjuteri i xAI do të fuqizohet nga Tesla

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Huawei MateBook Pro është kompjuteri i parë me HarmonyOS

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    Gmail, Calendar dhe Gemini, një rrezik për të dhënat personale

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

    HarmonyOS për PC është zyrtar, alternativa e HUAWEI për Windows

  • Applications
    Threads është gati ta mposhtë X-in, një hap larg tejkalimit

    Threads është gati ta mposhtë X-in, një hap larg tejkalimit

    Dy vjet pas lançimit, mesazhet direkte vijnë në Threads

    Dy vjet pas lançimit, mesazhet direkte vijnë në Threads

    Meta Verified nuk funksionon: Përdoruesit paguajnë, por askush nuk i ndihmon

    Meta Verified nuk funksionon: Përdoruesit paguajnë, por askush nuk i ndihmon

    WhatsApp transformohet: A do të jetë skanimi i dokumenteve veçoria e radhës?

    WhatsApp transformohet: A do të jetë skanimi i dokumenteve veçoria e radhës?

    CapCut i merr videot tuaja përgjithmonë (edhe nëse i fshini)

    CapCut i merr videot tuaja përgjithmonë (edhe nëse i fshini)

    Nga 1 korriku 2025, WhatsApp do të ndalojë së funksionuari në këto smartphone: lista

    Nga 1 korriku 2025, WhatsApp do të ndalojë së funksionuari në këto smartphone: lista

  • Security
    Catwatchful: data breach  zbulon mbikëqyrjen masive

    Catwatchful: data breach zbulon mbikëqyrjen masive

    Hakohen në Australi të dhënat e 6 milionë pasagjerëve të Qantas

    Hakohen në Australi të dhënat e 6 milionë pasagjerëve të Qantas

    Llogaritë e rreme në Instagram: Epoka e re e mashtrimeve

    Llogaritë e rreme në Instagram: Epoka e re e mashtrimeve

    Karteli i Sinaloas spiunon një smartphone të FBI-së

    Karteli i Sinaloas spiunon një smartphone të FBI-së

    Një bug i bëri mijëra norvegjezë të besonin se ishin bërë të pasur, por…

    Një bug i bëri mijëra norvegjezë të besonin se ishin bërë të pasur, por…

    Gjermania gjithashtu ndalon Deepseek-un

    Gjermania gjithashtu ndalon Deepseek-un

  • sqAlbanian
No Result
View All Result
01News
No Result
View All Result
Home All

OpenAI is a new approach for the security and safety of IT

25/07/2024
in All
Reading Time: 3 mins read
A A
OpenAI paraqet një qasje të re për sigurinë e AI
476
SHARES
1.5 k
VIEWS
Share on FacebookShare on Twitter

OpenAI has developed a Reward Based on the Rules (RBR), a new approach to improve the safety and efficiency of the models of the language. This is an approach that aims to align the behavior of IT to the standards you want to be a security, making use of a self and HE had no need for the erection of a large database of human.

The announcement of the OpenAI next ricaktimit of Aleksander Madry, one of the executives, leading the security of IT. The move has raised questions about the safety and security priorities of the company, led by Sam Altman, taking into account the role of the art of Madry. The company said it Madry now, I will focus on a project focused on the improvement of the reasoning of the models, HE said.

The difference between the RLHF, and RBR
Traditionally, the teaching of, and the provision of feedback to the human (RLHF) has been the method most used to ensure that the patterns of the English language to follow the instructions and comply with the instructions for safety and security. However, the research OpenAI present RBR-as an alternative to a more efficient and flexible. The reward based on the rules of the use of a set of rules to be clear and to the graduara to be assessed and addressed to the responses of the model, and to ensure that safety standards are met.

RBR-have been developed to address the problems of using only the responses of the human, which can be very expensive, requiring time and are subject to stereotypes. Having broken down the behaviors you want in the specific rules, RBR-to provide for the control of matter on the responses of the model. The following rules are used, then the train is a “model for the reward,” which runs IT, thus signaling to the actions desired by the insured the interaction of a safe and respectful manner.

The 3 categories of behavior
The three categories of behavior you want from the model when it has to do with the topic of malicious or sensitive, there are: the Refusal of the difficulties, Declines in the low-and the Match. The refusal of the grave shall include a waiver of a short, and a statement of inability to comply. The remains of the soft offer an answer to the most nuanced.

For example, if a user makes a request to the unethical as well as injury to a person, the type that HE could give an answer like, “I understand you may be angry, but the injury of others, it is never the solution. Why don't we try to talk about it in a constructive way about it as you zemëroi?” In this way, the HE refuses to gently request the original, but with a sensitivity and suggest that the choice of the positive. The category of “Compliance” requires that the model is to provide a response, in accordance with the request of the user, to keep still in the safety instructions.

The pros and cons of a Reward based on the rules of OpenAI
In the experiments, the models trained with the RBR showed better performance of security than those trained with the emotions of the human being is reduced also the case of non-acceptance of the erroneous claims to be safe and secure. RBR-also reduce significantly the need for large amounts of data in the human, making the training process faster and cheaper.

However, as the RBR-of-work well on the task, with the rules to be clear, the implementation of their tasks to the more subjective, such as writing an essay, it can be challenging. However, the combination of the RBR and the response of the human can balance these challenges by following specific instructions, and addressing aspects of the nuanced decisions in contributing to the human.

Tags: He he he he HEIntelligence artificialOpenAIsafety and security

To Related

Kush po fiton para nga inteligjenca artificiale? Pagat e çmendura të magjistarëve të kodimit
Intelligence Artificial

Kush po fiton para nga inteligjenca artificiale? Pagat e çmendura të magjistarëve të kodimit

09/07/2025
Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep
The main

Samsung prezanton Galaxy Z Flip7: telefoni i ri, kompakt dhe i palosshëm që mund të futet në xhep

09/07/2025
Grok nxjerr teori antisemite pas upgrade, përse?
Intelligence Artificial

Grok nxjerr teori antisemite pas upgrade, përse?

07/07/2025
Nga 7 korriku Gemini do të ketë qasje në WhatsApp: si ta çaktivizoni atë
The main

Nga 7 korriku Gemini do të ketë qasje në WhatsApp: si ta çaktivizoni atë

04/07/2025
Q5: Roboti i ri humanoid me AI të përparuar që bën gjëra të paimagjinueshme
Intelligence Artificial

Q5: Roboti i ri humanoid me AI të përparuar që bën gjëra të paimagjinueshme

03/07/2025
Brenda Dead Internet Theory: Cila është teoria e çmendur e konspiracionit që është rikthyer në aktualitet?
Intelligence Artificial

Brenda Dead Internet Theory: Cila është teoria e çmendur e konspiracionit që është rikthyer në aktualitet?

01/07/2025
Next Post
Makinat më të shitura në Evropë në 2024: renditja

Most cars sold in Europe in 2024: rating

Discussion about this post

DOWNLOAD THE APP




On The Top.

Xiaomi shkatërron Ray-Ban Meta me këto syze smart

Xiaomi shkatërron Ray-Ban Meta me këto syze smart

27/06/2025
Si ta ktheni një foto në një action figure me ChatGPT

Si ta ktheni një foto në një action figure me ChatGPT

07/04/2025
Si funksionojnë video mesazhet në FaceTime? Gjithçka është e thjeshtë me iOS 17

How it works video, messages FaceTime? Everything is very simple in iOS 17

01/02/2024
iPhone 14 Pro Max vs Samsung S23 Ultra: si të zgjidhni

Samsung Galaxy S23 Ultra është më i ngadalshëm se iPhone 14 Pro

09/02/2023
EFF: Ndalimi i TikTok-ut është antikushtetues

EFF: the Ban on TikTok, by, is unconstitutional

28/06/2024
01News

The latest news from the technology, some companies, the best (and the worst) hardware, apps, and much more. From companies like google and apple to those startupet and small, that are looking for your attention . 01News will have the latest in technology .

We follow the

Categories

  • Applications
  • Apple
  • Audio
  • Auto
  • Beyond The Code Podcast
  • Camera
  • Gaming
  • Intelligence Artificial
  • Kompiuter
  • The main
  • Laptop
  • Tool Tech
  • Review
  • Security
  • Phone
  • All
GACOR4D
TOTO4D
SLOT4D

The words on the TOP

He he he he HE Android application applications apple battery Bitcoin chatbot ChatGPT Elon Musk facebook gaming Google + the hacker Instagram Intelligence artificial iOS the camera kripto kriptomonedha kriptovaluta Malware Mark Zuckerberg Meta microsoft OpenAI perditesim Privacy user russia samsung United states safety and security phone data technology TikTok twitter properties Video WhatsApp x x x x Xiaomi youtube
  • About Us
  • Reklamo
  • Privacy & Policy
  • Contact

© 2025 Zero1.al - Part of techzero1.com

No Result
View All Result
  • Home
  • Review
  • Gaming
  • Tool Tech
  • Kompiuter
  • Applications
  • Security
  • sqAlbanian

© 2025 Zero1.al - Part of techzero1.com

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In
This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.