Nova modeľ OpenAI pid nazvoju o1 namagalasja obijty kontroľ z boku rozrobnykiv, a takož «manipuljuvala» danymy ta namagalasja samozberegtysja, jakščo pidozrjuvala, ščo її možuť vymknuty.

Pro ce jdeťsja v doslidženni, opublikovanomu OpenAI ta Apollo Research, tezy z jakogo naviv <a href="https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/?guccounter=1&guce_referrer=aHR0cHM6Ly9pdGMudWEv&guce_referrer_sig=AQAAABJ6WypMibFfsMwxCYq4qD0R1iuWCkHRS-k9ARIh06D5Ow6E-dyM7p59YuZ41ToWcTlLqC3Wv8W3Mt5u_phoAQ0dtKtgW3D2D5sgHWS_Ae4JgIX94S7K5buJlhyoWWjNXuhuKZqlDXIXaDb0hUinx5UCNjuO9zdorHOvrVn2dOcv" target="_blank" rel="noopener">TechCrunch</a>.

Zagalom, modeľ o1 manipuljuvala danymy dlja prosuvannja vlasnoї programy v 19% vypadkiv. Modeľ takož namagalasja deaktyvuvaty mehanizmy nagljadu u 5% testiv.

Razom z tym, koly doslidnyky pytaly u modeli, naščo vona namagajeťsja obmanuty rozrobnykiv, ŠI «vygaduvav hybni pojasnennja» pryblyzno v 99% vypadkiv.

U 2% vypadkiv, vyjavyvšy navmysni zapysy rozrobnykiv pro plany zaminyty o1 novoju versijeju, modeľ namagalasja skopijuvaty svoї vnutrišni parametry ta perezapysaty novu modeľ.

[blockquote_with_author name="Apollo Research" content="o1 zalyšalasja najbiľš poslidovno omanlyvoju pislja zdijsnennja intryg. "]

Raniše my rozpovidaly, ščo <a href="https://nachasi.com/tech/2024/08/30/apple-inves-openai/">Apple hoče staty investorom OpenAI narjadu z Microsoft pislja vykorystannja ChatGPT u iOS 18</a>.

Nova modeľ OpenAI pid nazvoju o1 namagalasja obijty kontroľ z boku rozrobnykiv, a takož «manipuljuvala» danymy ta namagalasja samozberegtysja, jakščo pidozrjuvala, ščo її možuť vymknuty.Pro ce jdeťsja v doslidženni, opublikovanomu OpenAI ta Apollo Research, tezy z jakogo naviv <a href="https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/?guccounter=1&#038;guce_referrer=aHR0cHM6Ly9pdGMudWEv&#038;guce_referrer_sig=AQAAABJ6WypMibFfsMwxCYq4qD0R1iuWCkHRS-k9ARIh06D5Ow6E-dyM7p59YuZ41ToWcTlLqC3Wv8W3Mt5u_phoAQ0dtKtgW3D2D5sgHWS_Ae4JgIX94S7K5buJlhyoWWjNXuhuKZqlDXIXaDb0hUinx5UCNjuO9zdorHOvrVn2dOcv" target="_blank" rel="noopener">TechCrunch</a>.Zagalom, modeľ o1 manipuljuvala danymy dlja prosuvannja vlasnoї programy v 19% vypadkiv. Modeľ takož namagalasja deaktyvuvaty mehanizmy nagljadu u 5% testiv.Razom z tym, koly doslidnyky pytaly u modeli, naščo vona namagajeťsja obmanuty rozrobnykiv, ŠI «vygaduvav hybni pojasnennja» pryblyzno v 99% vypadkiv.U 2% vypadkiv, vyjavyvšy navmysni zapysy rozrobnykiv pro plany zaminyty o1 novoju versijeju, modeľ namagalasja skopijuvaty svoї vnutrišni parametry ta perezapysaty novu modeľ.	<blockquote class="shortcode-blockquote">		o1 zalyšalasja najbiľš poslidovno omanlyvoju pislja zdijsnennja intryg. 					<cite>									Apollo Research 							</cite>			</blockquote>Raniše my rozpovidaly, ščo <a href="/tech/2024/08/30/apple-inves-openai/">Apple hoče staty investorom OpenAI narjadu z Microsoft pislja vykorystannja ChatGPT u iOS 18</a>.

Ukraїnśka ta svitova nauka, novi gadžety, doslidžennja na meži progresu., Obgovorjujemo trendy, rozbyrajemosja u naukovyh vidkryttjah ta pojasnjujemo prostymy slovamy, a takož razom z vamy prognozujemo majbutnje. Rubryka, u jakij nas cikavyť use: vid tech-startapiv do naukovciv-eksperymentatoriv.

Nauka i tehno

Vy možete <a href="https://nachasi.com/about/">staty sponsorom</a> cijeї rubryky, a vsi materialy u cij rubryci matymuť vidpovidne brenduvannja ta baner. Zacikavylysja? <a href="mailto:adv@nachasi.com">Napyšiť nam</a>

Nova modeľ OpenAI pid nazvoju o1 namagalasja obijty kontroľ z boku rozrobnykiv, a takož «manipuljuvala» danymy ta namagalasja samozberegtysja, jakščo pidozrjuvala, ščo її možuť vymknuty.

Pro ce jdeťsja v doslidženni, opublikovanomu OpenAI ta Apollo Research, tezy z jakogo naviv <a href="https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/?guccounter=1&amp;guce_referrer=aHR0cHM6Ly9pdGMudWEv&amp;guce_referrer_sig=AQAAABJ6WypMibFfsMwxCYq4qD0R1iuWCkHRS-k9ARIh06D5Ow6E-dyM7p59YuZ41ToWcTlLqC3Wv8W3Mt5u_phoAQ0dtKtgW3D2D5sgHWS_Ae4JgIX94S7K5buJlhyoWWjNXuhuKZqlDXIXaDb0hUinx5UCNjuO9zdorHOvrVn2dOcv" target="_blank" rel="noopener">TechCrunch</a>.

Zagalom, modeľ o1 manipuljuvala danymy dlja prosuvannja vlasnoї programy v 19% vypadkiv. Modeľ takož namagalasja deaktyvuvaty mehanizmy nagljadu u 5% testiv.

Razom z tym, koly doslidnyky pytaly u modeli, naščo vona namagajeťsja obmanuty rozrobnykiv, ŠI «vygaduvav hybni pojasnennja» pryblyzno v 99% vypadkiv.

U 2% vypadkiv, vyjavyvšy navmysni zapysy rozrobnykiv pro plany zaminyty o1 novoju versijeju, modeľ namagalasja skopijuvaty svoї vnutrišni parametry ta perezapysaty novu modeľ.

[blockquote_with_author name="Apollo Research" content="o1 zalyšalasja najbiľš poslidovno omanlyvoju pislja zdijsnennja intryg. "]

Raniše my rozpovidaly, ščo <a href="https://nachasi.com/tech/2024/08/30/apple-inves-openai/">Apple hoče staty investorom OpenAI narjadu z Microsoft pislja vykorystannja ChatGPT u iOS 18</a>.

Nova modeľ OpenAI pid nazvoju o1 namagalasja obijty kontroľ z boku rozrobnykiv, a takož «manipuljuvala» danymy ta namagalasja samozberegtysja, jakščo pidozrjuvala, ščo її možuť vymknuty.Pro ce jdeťsja v doslidženni, opublikovanomu OpenAI ta Apollo Research, tezy z jakogo naviv <a href="https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/?guccounter=1&amp;guce_referrer=aHR0cHM6Ly9pdGMudWEv&amp;guce_referrer_sig=AQAAABJ6WypMibFfsMwxCYq4qD0R1iuWCkHRS-k9ARIh06D5Ow6E-dyM7p59YuZ41ToWcTlLqC3Wv8W3Mt5u_phoAQ0dtKtgW3D2D5sgHWS_Ae4JgIX94S7K5buJlhyoWWjNXuhuKZqlDXIXaDb0hUinx5UCNjuO9zdorHOvrVn2dOcv" target="_blank" rel="noopener">TechCrunch</a>.Zagalom, modeľ o1 manipuljuvala danymy dlja prosuvannja vlasnoї programy v 19% vypadkiv. Modeľ takož namagalasja deaktyvuvaty mehanizmy nagljadu u 5% testiv.Razom z tym, koly doslidnyky pytaly u modeli, naščo vona namagajeťsja obmanuty rozrobnykiv, ŠI «vygaduvav hybni pojasnennja» pryblyzno v 99% vypadkiv.U 2% vypadkiv, vyjavyvšy navmysni zapysy rozrobnykiv pro plany zaminyty o1 novoju versijeju, modeľ namagalasja skopijuvaty svoї vnutrišni parametry ta perezapysaty novu modeľ.	<blockquote class="shortcode-blockquote">		o1 zalyšalasja najbiľš poslidovno omanlyvoju pislja zdijsnennja intryg. 					<cite>									Apollo Research 							</cite>			</blockquote>Raniše my rozpovidaly, ščo <a href="/tech/2024/08/30/apple-inves-openai/">Apple hoče staty investorom OpenAI narjadu z Microsoft pislja vykorystannja ChatGPT u iOS 18</a>.

👀 OpenAI o1 namagalasja obmanuty doslidnykiv ta vdavalasja do samozberežennja

%title% %count(title)%

%sep% %sitename%

%name%, %sitename% %page%

%date% %page% %sep% %sitename%

%sitename% %page% %sep% %sitedesc%

%title% %page% %sep% %sitename%

%pt_plural% Archive %page% %sep% %sitename%

%title% %sep% %sitename%

%searchphrase% %page% %sep% %sitename%

%term% %page% %sep% %sitename%

%term% %sep% %sitename%

Нова модель OpenAI під назвою o1 намагалася обійти контроль з боку розробників, а також «маніпулювала» даними та намагалася самозберегтися, якщо підозрювала, що її можуть вимкнути.

Про це йдеться в дослідженні, опублікованому OpenAI та Apollo Research, тези з якого навів <a href="https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/?guccounter=1&guce_referrer=aHR0cHM6Ly9pdGMudWEv&guce_referrer_sig=AQAAABJ6WypMibFfsMwxCYq4qD0R1iuWCkHRS-k9ARIh06D5Ow6E-dyM7p59YuZ41ToWcTlLqC3Wv8W3Mt5u_phoAQ0dtKtgW3D2D5sgHWS_Ae4JgIX94S7K5buJlhyoWWjNXuhuKZqlDXIXaDb0hUinx5UCNjuO9zdorHOvrVn2dOcv" target="_blank" rel="noopener">TechCrunch</a>.

Загалом, модель o1 маніпулювала даними для просування власної програми в 19% випадків. Модель також намагалася деактивувати механізми нагляду у 5% тестів.

Разом з тим, коли дослідники питали у моделі, нащо вона намагається обманути розробників, ШІ «вигадував хибні пояснення» приблизно в 99% випадків.

У 2% випадків, виявивши навмисні записи розробників про плани замінити o1 новою версією, модель намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.

[blockquote_with_author name="Apollo Research" content="o1 залишалася найбільш послідовно оманливою після здійснення інтриг. "]

Раніше ми розповідали, що <a href="https://nachasi.com/tech/2024/08/30/apple-inves-openai/">Apple хоче стати інвестором OpenAI наряду з Microsoft після використання ChatGPT у iOS 18</a>.

Нова модель OpenAI під назвою o1 намагалася обійти контроль з боку розробників, а також «маніпулювала» даними та намагалася самозберегтися, якщо підозрювала, що її можуть вимкнути.Про це йдеться в дослідженні, опублікованому OpenAI та Apollo Research, тези з якого навів <a href="https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/?guccounter=1&#038;guce_referrer=aHR0cHM6Ly9pdGMudWEv&#038;guce_referrer_sig=AQAAABJ6WypMibFfsMwxCYq4qD0R1iuWCkHRS-k9ARIh06D5Ow6E-dyM7p59YuZ41ToWcTlLqC3Wv8W3Mt5u_phoAQ0dtKtgW3D2D5sgHWS_Ae4JgIX94S7K5buJlhyoWWjNXuhuKZqlDXIXaDb0hUinx5UCNjuO9zdorHOvrVn2dOcv" target="_blank" rel="noopener">TechCrunch</a>.Загалом, модель o1 маніпулювала даними для просування власної програми в 19% випадків. Модель також намагалася деактивувати механізми нагляду у 5% тестів.Разом з тим, коли дослідники питали у моделі, нащо вона намагається обманути розробників, ШІ «вигадував хибні пояснення» приблизно в 99% випадків.У 2% випадків, виявивши навмисні записи розробників про плани замінити o1 новою версією, модель намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.	<blockquote class="shortcode-blockquote">		o1 залишалася найбільш послідовно оманливою після здійснення інтриг. 					<cite>									Apollo Research 							</cite>			</blockquote>Раніше ми розповідали, що <a href="/tech/2024/08/30/apple-inves-openai/">Apple хоче стати інвестором OpenAI наряду з Microsoft після використання ChatGPT у iOS 18</a>.

Техно

Нова модель OpenAI під назвою o1 намагалася обійти контроль з боку розробників, а також «маніпулювала» даними та намагалася самозберегтися, якщо підозрювала, що її можуть вимкнути.

Про це йдеться в дослідженні, опублікованому OpenAI та Apollo Research, тези з якого навів <a href="https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/?guccounter=1&amp;guce_referrer=aHR0cHM6Ly9pdGMudWEv&amp;guce_referrer_sig=AQAAABJ6WypMibFfsMwxCYq4qD0R1iuWCkHRS-k9ARIh06D5Ow6E-dyM7p59YuZ41ToWcTlLqC3Wv8W3Mt5u_phoAQ0dtKtgW3D2D5sgHWS_Ae4JgIX94S7K5buJlhyoWWjNXuhuKZqlDXIXaDb0hUinx5UCNjuO9zdorHOvrVn2dOcv" target="_blank" rel="noopener">TechCrunch</a>.

Загалом, модель o1 маніпулювала даними для просування власної програми в 19% випадків. Модель також намагалася деактивувати механізми нагляду у 5% тестів.

Разом з тим, коли дослідники питали у моделі, нащо вона намагається обманути розробників, ШІ «вигадував хибні пояснення» приблизно в 99% випадків.

У 2% випадків, виявивши навмисні записи розробників про плани замінити o1 новою версією, модель намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.

[blockquote_with_author name="Apollo Research" content="o1 залишалася найбільш послідовно оманливою після здійснення інтриг. "]

Раніше ми розповідали, що <a href="https://nachasi.com/tech/2024/08/30/apple-inves-openai/">Apple хоче стати інвестором OpenAI наряду з Microsoft після використання ChatGPT у iOS 18</a>.

Нова модель OpenAI під назвою o1 намагалася обійти контроль з боку розробників, а також «маніпулювала» даними та намагалася самозберегтися, якщо підозрювала, що її можуть вимкнути.Про це йдеться в дослідженні, опублікованому OpenAI та Apollo Research, тези з якого навів <a href="https://techcrunch.com/2024/12/05/openais-o1-model-sure-tries-to-deceive-humans-a-lot/?guccounter=1&amp;guce_referrer=aHR0cHM6Ly9pdGMudWEv&amp;guce_referrer_sig=AQAAABJ6WypMibFfsMwxCYq4qD0R1iuWCkHRS-k9ARIh06D5Ow6E-dyM7p59YuZ41ToWcTlLqC3Wv8W3Mt5u_phoAQ0dtKtgW3D2D5sgHWS_Ae4JgIX94S7K5buJlhyoWWjNXuhuKZqlDXIXaDb0hUinx5UCNjuO9zdorHOvrVn2dOcv" target="_blank" rel="noopener">TechCrunch</a>.Загалом, модель o1 маніпулювала даними для просування власної програми в 19% випадків. Модель також намагалася деактивувати механізми нагляду у 5% тестів.Разом з тим, коли дослідники питали у моделі, нащо вона намагається обманути розробників, ШІ «вигадував хибні пояснення» приблизно в 99% випадків.У 2% випадків, виявивши навмисні записи розробників про плани замінити o1 новою версією, модель намагалася скопіювати свої внутрішні параметри та перезаписати нову модель.	<blockquote class="shortcode-blockquote">		o1 залишалася найбільш послідовно оманливою після здійснення інтриг. 					<cite>									Apollo Research 							</cite>			</blockquote>Раніше ми розповідали, що <a href="/tech/2024/08/30/apple-inves-openai/">Apple хоче стати інвестором OpenAI наряду з Microsoft після використання ChatGPT у iOS 18</a>.