Вы слушаете Артём Подкаст.
Это уже практически ежегодный подкаст. В последний раз он выходил больше года назад. За этот год произошли некоторые интересные вещи, которые Артёма интересуют, особенно в тех областях, которые касаются искусственного интеллекта, технологий и всего того, чем Артём занимается. И поскольку объять за короткий выпуск подкаста сразу все перемены не представляется возможным, Артём решил поступить по-другому. Он всех своих немногочисленных слушателей оповестил о том, что будет записываться этот подкаст, и попросил,чтобы они написали, о чем им интересно было бы услышать в этом подкасте. И вот сегодняшний подкаст так будет построен, что Артём будет отвечать и комментировать те вопросы и сообщения на заданную тему, которую его слушатели ему задали.
И первый вопрос или комментарий.
Все они будут на тему искусственного интеллекта от Станислава за развитием ИИ. Мне интересно наблюдать и радоваться успехом разработчиков, пишет Станислав. Там с юмором вроде есть проблемы. ИИ анекдотов и шуток не понимает и сочинить не может.
Ну, насколько Артёму известно,действительно у тех лингвистических моделей, которые мы будем называть ИИ искусственным интеллектом, действительно отсутствует какая -то глубокая истина, которая, конечно, в сфере юмора. Но тут важно отметить, что для того, чтобы получался юмор или создавалась юмористическая ситуация, не обязательно нужно, чтобы источник и юмористической ситуации был как раз на её создание нацелен. То есть, если юмор, мы можем говорить, происходит в глазах и в головах наблюдающих, если шутка или какой -то понятный публике, то публика юмору радуется. А если ситуацияили эпизод наблюдателю не кажется забавным, даже если рассказчика хотел, чтобы шутка произвела комический эффект, то юмора в глазах публики в таком случае не будет. Поэтому юмор – это всегда вопрос ожиданий. То есть, юмор – это когда есть определённые ожидания, и эти ожидания обманываются каким -то умным или не очень образом, происходит подмена следующего ожидаемого состояния на что -то оригинальное или контрастирующее с ожиданием слушателя. И когда слушатель понимает, что он подменил ожидаемое на что -то другое, и слушательв курсе, и они оба как бы знают, что только что во фразе или в эпизоде что -то произошло не так, как все ожидали, но все об этом заранее знали, вот тогда обычно возникает эффект юмористической ситуации.
Что касается ИИ и о том, как ИИ составляет шутки и анекдоты, ну, можно поговорить о том, как ИИ в целом составляет фразы, и, наверное, из этого попытаться проследить, как ИИ составляет юмористические фразы. Те лингвистические модели, которые мы сегодня называем ИИ, которые у нас сейчас есть, работают следующим образом. Большому кластеру, большой группекомпьютеров ученые скормили практически все доступные человечеству тексты, все, что есть в интернете, все, что есть в книгах, все знания, что у нас были, были скормлены этим компьютером в попытке научить или вернее сказать дистиллировать эти знания в такую форму, компактную, чтобы на основе этой компактной формы потом компьютер мог какие -то знания вытаскивать и какие -то понятия разворачивать во фразы. То есть, когда такая модель делает вот эту самую операцию разворачивания, так сказать, вопроса, то что происходит, она, пытаясь, смотря внимательно на вопрос,она пытается продолжить его. Или любой текст, не обязательно если это вопрос, она будет пытаться следующее слово в предложении вставить наиболее подходящее к тому, что было перед ним. То есть, если у нас есть такой формат, когда идет беседа вопрос -ответ как интервью, то модель видя, что ей был задан вопрос и что от нее ожидается ответ, попытается этот ответ сформулировать на основе вопроса. То есть, она, как если бы вы читали журнальную статью и там было интервью с кем -нибудь. Вот журналист задает вопрос, а дальше человек, которого интервьюрует, дает ответ.Вот, если вы можете уже по вопросу предположить, какой ответ будет дан, то вот именно это как бы и делает искусственный интеллект сегодня, который у нас есть пока что.
Это значит, что если его попросить написать шутку, то он, основываясь на всем объеме текстов про юмор, анекдотов и про шутки, которые он видел, попытается синтезировать такую фразу, которая будет подходить под запрос. То есть, он попытается, грубо говоря, синтезировать шутку, написать ее или любой другой ответ. В чем здесь проблема? Причем делаетон это таким образом, что, как я уже сказал, слово за словом строит предложение. То есть, начинает сначала предложение, потом первое слово, второе, третье и так далее, пока не закончится у него, грубо говоря, место. Он будет делать это бесконечно, но мы придумали способ, как остановить его в более -менее разумном месте, но в принципе технически ничто не ограничивает этот поток подставления каждого следующего слова в такое предложение со стороны искусственной интеллекта, и он может делать это до бесконечности долго. Значит, поскольку он делает этослово за словом, то он не всегда, а вернее почти никогда не знает, куда к чему он ведет. То есть, начав строить предложение и понятия не имеет, чем это предложение закончится, пока он его не закончит строить. Именно поэтому в текущих системах ИИ, которые доступны широкой публике, часто можно наблюдать такой эффект, когда на запрос ИИ отвечает, так слова появляются прямо слово за словом, появляются на экране последовательно друг за другом. То есть, он отвечает не сразу параграфом или целым предложением, а он вот прямо видно, как он прямо печатает как будтобы по одному слову и черним по одной букве. Это как раз прямое следствие того, как эта штука работает изнутри. То есть, она просто предсказывает следующее слово в предложении на основе предыдущих слов в этом же предложении. И зная это, можно понять, почему юмор в целом планирование и другие задачи, которые требуют знать заранее, где ты хочешь закончить, вызывают некоторые сложности. То есть, в задачах, где можно идти от старта к финишу шаг за шагом, не зная, где ты закончишь, с такими задачами ИИ справляться натурально и легко. А задачи,которых ИИ должен заранее знать, куда к чему он ведет, чтобы туда прийти. Вот эти задачи гораздо более сложные для ИИ.
Естественно, люди придумали кучу разных техник и методик, как заставить и такого рода задачи искусственный дилект решать. И до сих пор придумывают. Сейчас большая работа идет в этом направлении. Но вот этот факт, что внутри систем больших языковых моделей нету никакого внутреннего планирования, а есть только такое дополнение новой информации на основе предыдущей информации, то есть построение предложения словом за словом, шаг зашагом. Из -за этого иногда можно наблюдать, как, например, ИИ начал решать проблему, и он начал ее не с того конца, как, грубо говоря, решать. Неправильно подошел к решению проблемы. И это приводит к тому, что он посередине своего решения, вот как он его записывает, слово за словом, он не может сам себя поймать и сам тут же на месте развернуться и передумать и начать с другого конца проблему решать. То есть ИИ будет решать проблему так, как он ее уже начал решать, до тех пор, пока он не закончит выписывать свое решение. При этом можнотак с натяжкой некоторые исследователи говорят о том, что даже если ИИ как бы в кавычках знает, что он неправильно начал решать, он все равно продолжит неправильно решать. Но тут, конечно, вопрос о том, что означает слово знает в этом контексте, но это уже другой вопрос. Но, в общем, есть вот такой вот эффект, что поскольку это просто построение предложений от начала до конца и нету никакого заранее планирования наперед, такая область человеческой экспрессии, как юмор, дается ИИ нелегко. Ну, собственно, наверное,на этом эту тему мы разобрали.
Следующий вопрос про использование ИИ в беспилотниках
а также про влияние на рынок труда, про то, чему можно пойти учиться в связи с этим ИИ, чем потом пойти работать.
Ну, про использование в беспилотниках имеется в виду военные дроны, беспилотные летательные аппараты боевого назначения. Я так понимаю, и недавно была такая резонансная история о том, что многие военные заинтересованы в использовании системы искусственного интеллекта в военном деле, и в частности в том, что применять и позволять ему давать ему контрольнад беспилотными летательными аппаратами для выполнения боевых задач. Для чего это нужно? Казалось бы, как бы, аппараты и так уже беспилотные, то есть пилот сидит где -то в центре управления, а робот с крыльями летает сам по себе, но на радиоуправлении удаленном. Ну, собственно, есть две причины. Первая, зачем это может пригодиться, зачем там нужен ИИ. Это в том, что ИИ может принимать решение в условиях потери связи, например, с центром управления, или кратковременно потери связи, или когда связи вообще невозможно наладить. Соответственно, вот можнодать заранее такому компьютеру с крыльями задачу, такому роботу беспилотному, и он полетит ее выполнять, и мы можем быть практически уверены, что он ее выполнит даже без надзора и контроля из центра управления. И второй момент о том, что ИИ может принимать более взвешенные или более молниеносные решения в разных ситуациях. Пока что это спорный вопрос, потому что все -таки команда натренированных профессионалов, наверное, сможет принимать решение не хуже, чем ИИ на данный момент. Что касается скорости принятия этих решений. Ну, как я уже отметил,те системы ИИ, что у нас есть сегодня, работают довольно медленно, и можно невооруженным глазом наблюдать эту скорость. Каждый раз, когда вы задаете ИИ вопрос, нужно сидеть и секунд 30 ждать, пока же он допечатает ответ до конца. Вот можно себе представить, что в условиях, так сказать, боевых такая скорость неприемлема, конечно же, для принятия решений.
Вообще, в целом, технологии ИИ в данный момент, в 2023 году, находятся на том же уровне, примерно на котором 3D графика находилась в 90 -х. А если, может быть, слушатели помнят такое замечательноемультик, как История игрушек, вот если посмотреть на первую часть мультика История игрушек, на уровень 3D графики, которая в нем применялась, то сегодня такой мультик с таким 3D графикой, с таким уровнем 3D графики может выпустить, собственно, любой человек, у которого есть доступ к более -менее сносному компьютеру, не знаю, долларов за 200, наверное. То есть, а тогда это было, когда вышел мультик История игрушек, тогда это было по тем временам считалось пиком технологического прогресса и требовалось огромное количество очень мощных и дорогих компьютеров,чтобы мультик этот отрисовать и собрать воедино, в единую киноленту, которую потом можно показывать в кино и по телевизору. Вот примерно на таком же уровне технологии мы находимся сейчас искусственным интеллектом. Очень много дорогих и мощных компьютеров сегодня требуется на то, чтобы достичь даже вот этой вот мизерной скорости ответа и что у нас есть, которая пока что, к сожалению, оставляет желательно много лучшего, но, как мы знаем, технологический прогресс не стоит на месте и, как мы видим, 3D технологии за 30 -40 лет пришли к тому, что у нас в режиме реальноговремени можно запустить видеоигру на довольно обычном домашнем компьютере и она будет иметь фотореалистичную графику. Без особых проблем, естественно, можно, используя более мощные компьютеры, уже профессионально отрисовать мультик гораздо более визуально и графически сложный, чем история игрушек, что, собственно, многие современные студии делают. И, глядя на эту эволюцию, можно предположить, что нечто подобное нас ждет и в области искусственного интеллекта, что будут применены больше усилий в этой области, чем до этого и что все больше и больше мы будем спускатьсявот к этой заветной цифре, когда можно будет достаточно мощный ИИ запустить даже на телефоне или же на обычном домашнем компьютере, даже еще более мощный. Я думаю, что, опять же, через 20 -30 лет вполне возможно, что и те технологии, что у нас есть сейчас искусственного интеллекта будут нам казаться игрушечными и то, что мы делаем сейчас на очень дорогих и мощных компьютерах, на серверах будет возможность делать на детском игровом планшете за вечерок без всяких проблем.
Так что в данном случае моменты использования и в военных целях, и в беспилотникахв частности ограничены этими факторами, что технология это все -таки слишком молода. В технологическом плане еще много нас ждет развития, но определенно перспективно. Поэтому многие лаборатории, в том числе военные лаборатории с большим интересом пробуют их, изучают, и в процессе этого, конечно же, этих экспериментов будет много ошибок, много неудач, но в итоге мы, скорее всего, все -таки научимся их применять с достаточной скоростью, эффективностью и освободим, возможно, многие должности, которые сегодня занимают люди таким образом в этойсфере. Что касается рынка труда и о том, как ИИ на него влияет, ну тут можно, опять же, подискутировать на тему того, что есть вот эта фраза, что на этот раз все точно по -другому, которую я часто слышу о том, что скептики ИИ и люди, которые относятся к появлению такой технологии с некоторой настороженностью или даже пренебрежением, говорят, что вот, мол, у нас уже был период большой промышленной революции, когда паровой двигатель стал широко применяться, он освободил множество рабочих рук и появились новые должности, новые профессии,в которые люди в итоге переобучились и стали ими заниматься. Потом было множество других промышленных революций. Одна из недавних, например, это Интернет, когда информация стала глобально широко доступна и это тоже сильно изменило многие области жизни, многие бизнесы и сильно изменило рынок труда, то, как мы делаем работу, что за работу мы делаем и как она выгодит. И есть мнение, что и текущая революция ИИ приведет к нечто подобное, что те работы, которые были и которые у нас до недавнего времени есть и сейчас будут упразднены,станут ненужны и появятся новые работы, которые сделают нас еще более счастливыми и дадут нам еще больше свобод.
Это одна точка зрения, скажем так, исторически оптимистичная. Есть другая точка зрения, о том, что на этот раз все по -другому, о том, что если мы хотим, чтобы будущее действительно было прекрасным, нужно бороться за это, политически бороться и экономически бороться, придумывать различные регуляции и законы, которые защитят рабочих, в частности тех, чьи профессии уже начали активно замещаться системами с ИИ. Мы уже видим, что происходятзабастовки людей, напрямую делающих то же самое, что делают ИИ, а именно людей, составляющих тексты. Недавно прошла забастовка сценаристов в Голливуде, то есть людей, которые собственно составляют тексты. Они увидели, что их работодатели, а именно студии, с большой радостью распрощаются с ними и более не нуждаются в услугах человеческих сценаристов при наличии ИИ. Если этот ИИ будет приносить им точно такие же тексты, с точно таким же качеством, что и люди, но за гораздо меньшую цену. Как говорится, если не видно разницы, зачемплатить больше? И именно эта мысль о том, что в этот раз все по -другому, в смысле, что это не просто потеря рабочих мест, когда человек может переобучиться и жить в новых экономических реалиях с новыми технологиями, но проблема с ИИ в том, что переобучившись человек, который занимался, например, сценарист, чему он может переобучиться? Поставим вопрос так. Вот как раз он спрашивает, чему можно пойти научиться в связи с этим и кем потом работать. То есть, когда есть система, которая делает ту же работу, что делал человек, но онаделает ее гораздо дешевле или гораздо лучше, и при этом она не просто заменяет более монотонную часть работы, она заменяет в целом от И до весь процесс, от появления идеи для сценария и заканчивая финальной версией. Полностью всю производственную цепочку можно заменить на ИИ, предположим. На выходе результат получится такой же хороший, как если бы над ним работала команда людей.
К чему это приводит? К тому, что люди не могут переобучиться с тем, чтобы улучшить качество своей работы. Все, что они могут сделать, это переобучиться, чтобы сменить свою профессиюсовсем на ту область, в которой ИИ пока что, которая не доступна. То есть, например, в данный момент системы, которые у нас есть, они, ну, это программное обеспечение, то есть AI, которые у нас есть, ИИ, которые у нас есть, это software, у него нет физических ручек, ножек, у него нет тела, он не ходит по городу, например, и не собирает мусор, скажем. То есть, например, люди, которые писали сценарии, испытывают в этой среде конкуренцию, подавляющую их рынок, конкуренцию со стороны ИИ, по мне, могут перейти на рынок, где такой конкуренции пока что не предвидится,рынок физического труда, скажем, и там искать себе применение. У этой идеи есть несколько проблем. Однако дело в том, что экономика в данный момент построена таким образом, что так называемый умственный труд приносит, как правило, больше денег, чем труд физический. И людей, способных заниматься высококачественным умственным трудом, относительно не много на планете, и за это они, собственно, и получают свои деньги. Как известно, ценится то, что является редким. Дар писать хорошие сценарии до недавнего времени являлся редким. Вот дар ходить по улице и подбирать брошенные окурки в урну и складывать все это в пакетик редким не является, и поэтому ценится не очень высоко.
Несмотря на то, что сейчас у нас все еще, я бы не сказал, что прям и настолько хорош, что можно полностью заменить всю умственную работу на планете вот прямо сегодня. Я бы сказал, что скорость, с которой и развивается, определенно приведет нас в такую точку, в которой дар ходить по улице и собирать окурки будет гораздо более редким, чем дар заниматься умственной работой. Потому что компьютер может заниматься умственной работой 24 часа в суткибез зарплаты. Все, что ему нужно, это электричество. А электричество, как известно, дешево. Если мы учтем, что, как я и сказал, технология и скорость работы ИИ будет только увеличиваться и развиваться, это значит, что он будет становиться все дешевле и дешевле в эксплуатации. А значит, умственного интеллекта на планете и ресурса умственного интеллекта на планете будут становиться с каждым годом в разы, в десятки и порядки раз больше, чем людей на планете сегодня. И в связи с этим, чему можно научиться и кем потом пойти работать, есть, скажем так, среднесрочнаяи долгосрочная перспектива, которые проглядываются в этом вопросе.
Среднесрочная перспектива заключается в том, что, как я сказал, в данный момент тот искусственный интеллект, что у нас есть, не является финальным, скажем так, или то, что называется в научной литературе artificial general intelligence, общий искусственный интеллект, так называемый или еще говорят, сильный искусственный интеллект, то есть он пока что все еще уступает человеческому или группе натренированных профессионалов во многих вопросах, но он приближается потихоньку по некоторымоценкам, где -то на 80 -90 % уже во многих областях приблизился к человеческим возможностям. Это значит, что 80 -90 % работы этой самой умственной, этого самого ресурса можно уже включать в каждодневную рабочую практику, и многие профессионалы, особенно те, что связаны с работным с текстами, такие как программисты, например, уже во всю каждый день, уже на протяжении почти года используют технологии искусственного интеллекта, и многое из того, что видно уже сейчас, это такая аугментация, дополнение человека вот такими вот возможностями ИИ, когда человек работаетв паре с ИИ, соответственно, чему можно научиться в среднесрочной перспективе, пока у нас нет еще сильного интеллекта, это можно научиться работать с этим искусственным интеллектом в паре и попытаться в этом тандеме выкроить себе нишу на рынке труда, которая выгодно подсветит навыки человека, при этом человека, который уже не просто человек, а человек, работающий в паре с компьютером.
Здесь это не сильно отличается от того, как, скажем, в прошлом калькуляторы стали более доступны широкой общественности и люди, которые учились, как им пользоваться, я помнюдаже были специальные книжки такие для детей о калькуляторах, о том, как можно калькуляторой программировать, для чего нужны кнопочки M +, M-, MR, AMC и так далее. И потом уже, опять же, компьютеры, которые, по сути, свои большие такие сложные калькуляторы, о том, как работать с компьютерами, тоже огромное количество специальной литературы появлялось в свое время, когда был вот этот переход от, скажем так, ручной такой бумажной бухгалтерии и документа оборота на компьютерные системы, когда люди в конторе, конторские служащие, рабочие до этого работали с архивными бумажнымидокументами, писали пером и ручкой, вели ведомости, учились, как все это, то же самую работу делать на компьютере. Вот примерно в таком же ключе работу можно вести и сейчас. Можно садиться. Каждый день садиться напротив ИИ и пытаться включить его в свою каждодневную работу. Вот какие обязанности вы выполняете каждый день. Вот садитесь вместе с ИИ и учитесь вместе с ним выполнять эти обязанности. Старайтесь как можно больше уделять внимание тому, как именно можно вот эти вот свои обязанности так и развернуть, чтобы он как можно более эффективно их за вас сделал или предложил вамрешения готовые, а вы их потом просто своим именем написали и отправили на суд своему работодателю.
Это в среднесрочной перспективе, а в долгосрочной, как я уже сказал, в этот раз все по -другому. В смысле того, что это не просто компьютер, который усиливает интеллект человека, а это компьютер, который заменяет интеллект человека полностью или даже превосходит его в будущем. Соответственно, если вы хотите думать в долгосрочной перспективе, то больше всего я вам советую обратить внимание на те области, в которых у нас пока что недостаточно ресурсов на планете, чтобы снабдить,скажем так, эти рынки достаточным количеством металлических рук и ног. Именно я говорю о физическом труде, о труде руками, потому что, например, такая замечательная и благородная профессия, как водопроводчик в красной перспективе с буквой М и шикарными усами, она никуда не уйдет. И более того, руки, которые есть у человека, вот эти 10 пальцев, мягких таких довольно с ногтями, они довольно -таки сложный инструмент, как бы это странным ни казалось, разработанный за миллионы лет эволюции, и воспроизвести его в роботе не так -то и просто. К примеру, компанияSony, японская, которая производит в том числе видеоигровые системы PlayStation в своей последней видеоигровой системе На фабриках вынуждены были вложить целую кучу денег и разработать специальные роботизированные манипуляторы, которые смогут вставлять гибкие провода в платы на конвейере сборки этих самых PlayStation. В чем проблема? Проблема в том, что гибкий провод тяжело вставить роботу, у которого, грубо говоря, металлические клешни вместо рук, а человеку легко, потому что у человека мягкие пальцы, которые гнутся, и очень точно могутпопадать мягким проводом в правильное гнездо, и на многих, многих фабриках и многие устройства, которыми мы пользуемся каждый день, если там есть какие -то такие гибкие коннекторы, которые нужно соединять два блока, скажем, две платы, то, скорее всего, их вставляют люди на фабриках просто потому, что человеческая рука справляется именно с этой конкретной задачей лучше, чем металлическая клешня робота.
Но, как я уже сказал, роботы такие возможны, и они существуют, и это лишь вопрос ресурсов, то есть сколько мы таких роботовможем построить на планете, с одной стороны, экономически, а с другой, сколько бесплатных или очень дешевых, гибких биологических рук можно просто -напросто нанять на планете, чтобы выполнять ту же работу, которая требует, например, человеческих рук в качестве манипуляторов. И в итоге, даже если на такой фабрике, скажем, человек будет всего лишь манипулятором, то есть думать ему уже не нужно будет, думать за него будет ИИ или компьютер, говорить ему какую штучку куда вставить, или даже тот же водопроводчик будет уже за него компьютер думать,говорить ему какую трубу куда подсоединить и каким ключом завернуть, но тот факт, что биологический аппарат рук, ног и нашего тела все еще более совершенен, чем наши железные роботы и более дешевый, что самое главное в контексте рынка труда, этот факт будет держать многие профессии еще долгое время, даже после появления сильного ИИ на планете при прочих равных. Так что можно пойти учиться в профессии так называемых синих воротничков, там вам ничего не грозит, кроме того, что скорее всего приказ вам будет отдавать уже компьютер, а вы будете лишьисполнять их, но своими руками, которые пока что ничем не заменить, ну или не заменить в тех масштабах, в которых у нас есть в этом потребность экономическая, опять же, подбирать окурки на улице в урну гораздо проще человеку, чем роботу.
Следующий вопрос от Владимира
мнение он хочет услышать о роли современных технологий в обычной жизни людей напрямую с IT несвязанных, например, уводит ли всех бухгалтеров, что, значит, глубоко ли войдут нейронные сети в нашу жизнь, даже если обычный, так называемый
как я уже говорил, современные технологии в нашей жизни принимают активное участие, даже когда мы об этом не знаем, на всех этапах производства, всех продуктов, которые мы потребляем, всех товаров, что мы покупаем, как правило, или уже есть, или в ближайшем будущем появится искусственный интеллект на производстве, а значит, что все, что мы используем, все предметы и товары, что нас окружают каждый день, не говоря уже о всех цифровых предметах и цифровых товаров, которые мы потребляем каждый день, все этого и коснется на том или ином этапе, большую часть этого, конечно же, все еще контролирует люди,и в современном мире законы пока что написаны людьми для людей, это значит, что когда что -то идет не так, то ответственными за это, опять же, бывают люди обычно, а не роботы. Не было еще прецедентов, чтобы компьютерная программа, ее признали ответственными за какой -то случай на производстве или несчастный инцидент, всегда ответственными признавали людей, так или иначе, этой программой или управлявших, или продавших ее, или же производующихся ей.
Что касается уволит ли всех бухгалтеров, как я уже говорил в предыдущем параграфе,что в среднесрочной перспективе уволит только тех бухгалтеров, которые не желают работать в паре с ИИ, или не умеют, или не хотят учиться. Тех, кто сумеет адаптироваться, найти общий язык с ИИ, конечно же, оставят и повысят, и заставят других обучать. Но это, конечно же, касается не только бухгалтеров, а всех любых профессий напрямую, так сказать, с ИТ несвязанных, как Владимир пишет здесь. Самым интересным, на мой взгляд, является долгосрочная перспектива, в которой, как мне кажется, бухгалтеров уволят, в смысле, что упразднят вот эту позицию, когдачеловеку приходится сидеть и подсчитывать цифры, даже если на компьютере, и принимать какие -то решения, или следить за какими -то законами, ведь, как я понимаю, большая часть вот такого рода консультантов, типа бухгалтеров, юристов и так далее, их ценность не в том, что они знают, как заставить компьютера правильные числа сложить или вычесть, а в том, что они следят за всеми выходящими законами и работой своей гарантируют, что у бизнеса при новых законах и новых обновляющихся регуляциях не будет никаких проблем с государством и с контролирующимиорганами. То есть, по сути, вся их работа сводится к тому, чтобы оставаться в курсе того, как сейчас принято подсчитывать цифры, и своим клиентам они, так сказать, эти цифры считают в соответствии с последними новостями и регуляциями, чтобы ни у кого никогда не возникало вопросов к тому, как эти числа посчитаны. Собственно, за всеми этими новостями и может с легкостью следить уже и сегодня и давать рекомендации относительно того, как все эти регуляции применять к конкретным числам и к конкретным бизнесам, к конкретным бизнес -процессам.Это уже решенная задача.
И, соответственно, все, что в данный момент остается нам, это, по сути, подпись человека под всеми этими выводами. Потому что, как я уже говорил, все решения, которые приняты в такой программой, и суды все еще судят людей, а не программы. Это значит, что решение, принятое такой программой, не имеет никакой ценности до тех пор, пока это решение не будет подписано человеком. И вот с этой человеческой подписью уже можно иметь судебное дело. И, соответственно, человек, который с такой программой и советуетсяили сотрудничает, его задача становится уже не в том, чтобы, скажем, следить за всеми регуляциями или знать, как все числа нужно складывать, как бухгалтер, а в том, чтобы понимать, когда и неправ, и уметь распознать вот эти ситуации, когда искусственный интеллект ошибся. Это несколько другой навык. Я не совсем уверен, что этот навык требует каких -то специальных особых знаний. Возможно, поначалу он будет требовать каких -то специальных особых знаний в то или иной прикладной области. Например, для адвокатов или юристовбудет важно знать свою прикладную область, чтобы понимать, правильное ли решение и вынес по тому или иному вопросу. Или бухгалтеру нужно будет знать свою бухгалтерию, своего государства и свои области бизнеса, чтобы понимать, правильно ли регуляции были применены, правильно ли числа были сложны и посчитаны. Но я подозреваю, что со временем все меньше и меньше нужно будет знать прикладную область, и все больше и больше нужно будет знать, как размышляет ИИ конкретный. То есть нужно будет приближаться к тому, чтобы становитьсяспециалистом в решениях ИИ, а не специалистом в своей области. То есть нечто подобное, наверное, делают, скажем, люди, которые принимают рискованные решения, например, бизнесмены, когда важность решения основывается не столько на каких -то бизнес -факторах, сколько на умении прочитать человека за столом переговоров и понять, основываясь на неполноте информации, понять, как следует поступить. Вот примерно так же, видимо, будет построена в будущем работа с такими системами ИИ, когда нужно будет, скажем так, прочитать, посмотретьмежду строк того отчета, что подготовил ИИ, и основываясь на неполноте этой информации, не зная, как он пришел к такому выводу, или не имея возможности проверить всю его цепочку решений, нужно будет понять, стоит ли ему доверять или нет, и видимо, от этого будет зависеть успех таких профессий.
Тут еще интересный вопрос о том, что если мы представим себе такую систему, в которой вот такой специалист работает в паре с ИИ, и он, этот ИИ в 99 % случаев прав, то есть в подавляющем большинстве случаев решение или отчет искусственного интеллекта,который он предоставляет, он правильный, он соответствует всем регуляциям, там все правильно посчитано, и вопросов к нему не возникает, но в одном проценте случаев, скажем, он делает ошибку, и вот что будет делать такой оператор такой системы, который сидит за этим компьютером, и вся его работа заключается по сути в том, чтобы ставить подпись под документами, которые ему предлагает ИИ, которые в 99 % случаев верны, но в одном проценте случаев бывают ошибочно. Что будет делать такой человек? Скорее всего, основываясь на том, что люди по природе своейстараются идти путем наименьшего сопротивления, стараются консервировать полезную энергию, чтобы не тратить ее попустой. Иными словами, люди ленивы и не всегда относятся с должным вниманием к тому, что происходит у них перед носом. Скорее всего, мы можем представить, что оператор такой системы, имея, скажем так, на экране кнопки зеленую подтвердить и красную не подтверждать, зная, что система в 99 % случаев права, скорее всего, будет нажимать на зеленую кнопку подтвердить, даже особенно не вчитываясь, потому что зачем? 1 % не стоиттого, и потом, скорее всего, система же все равно права, поэтому зачем каждый раз сидеть и перепроверять?
И в итоге мы получаем такой мир, такую систему, в которой решения ИИ, какие бы они ни были, но если мы все знаем, что они в 99 % случаев правильные, а 1 % случаев мы не проверяем, потому что мы ленивы, мы получаем такой мир, в котором 100 % решений ИИ, по сути, подтверждаются. Иными словами, подписываются, человеком заверяются и отправляются дальше по цепочке экономической, как верные. Из этого следует несколько очень интересныхвыводов. Первый это, что обучать новой системой ИИ становится уже не так просто, поскольку фактически тот ИИ, который уже есть, который на 99 % верный, не получает никакого полезного отклика на свои действия о том, правильно он решил задачку или нет, потому что человек просто -напросто игнорирует неправильные решения, и ИИ не может обучиться, он думает, что все, что он делает, это правильно.
И второй момент – это что мы получаем мир, в котором люди относятся к ИИ как к какой -то такой вероятностной системе, которая имеетриск 1%, и соответственно, соответствуясь этому риску, мы можем провести такую границу, в каких областях ИИ можно будет применять, а в каких нет. То есть если это бизнес -область, в которой позволительен риск в 1%, то, скорее всего, все ее операторы такие вот относительно бесполезные будут заменены ИИ, даже зная, что в 1 % случаев он не прав. Скорее всего, руководитель такого бизнеса придет к мысли, что если 1 % для него окажется, покрытие убытков от этого 1 % окажется дешевле, чем платить специалистам, которые, по идее бы, должны этот процент вылавливать,скорее всего, специалисты эти не пригодятся такому бизнесу. Но если бизнес повлияет, или если, скажем так, экономические факторы повлияют на бизнес таким образом, что даже вот такой 99 % ИИ не является достаточным. То есть если это какие -то критические системы, где нам нужно близко к 100 % процент попаданий, если это системы связанные с большими затратами, например, или же если эти системы напрямую как -то связаны с жизнями большого количества людей и с их выживанием на этом планете, то, скорее всего, все -таки останутся операторы и останутся цепочкирешений, где большую часть работы все еще будут делать люди, несмотря на то, что есть ИИ, который мог бы их заменить в 99 % случаев, но поскольку они не могут себе позволить даже такой маленький риск, то все будет делаться вручную, чтобы, так сказать, ну или наполовину вручную, но тщательно проверяться, чтобы гарантировать более высокий процент попадания в цель.
Следующий вопрос от Евгения.
Было бы интересно послушать, как соединять разные ИИ между собой.Допустим, GPT -4 и голосовой ИИ.
Ну, на эту тему сейчас как раз ведутся исследования многими лабораториями. Собственно, о чем вопрос? Вопрос в том, что в данный момент тот ИИ, что у нас есть, он имеет, по большому счету, текстовый интерфейс. Это значит, что на вход он получает текст, как правило, на английском языке, и на выходе он тоже выдает текст. Но хотелось бы многим, чтобы ИИ мог работать не только с текстом, но и с другими формами информации, с визуальными,с картинками, с видео, с музыкой, с голосом, с аудио. И также еще очень интересный вопрос тоже из этой области. Это работа с движением. Например, если мы возьмем такой ИИ, который будет управлять автономной системой типа автомобиля, то можно себе представить, что входящие данные для такой системы – это информация с камер и различных устройств, которые позволяют осязать происходящее вокруг автомобиля. А исходящая из такого ИИ информация – это сигналы управления для педали газа, тормоза и руля автомобиля. И соответственно, многие лаборатории сейчас работают над тем,чтобы сделать такие модели, такой ИИ, который будет сочетать в себе возможности в одной модели работы с разными медиа и с разными типами информации, не только текстовой, но и информации о движении, информации визуальной, аудиоинформации. И такие модели уже показали некоторые интересные результаты, но они по большому счёту в данный момент находятся в такой исследовательской стадии.
В данный момент широкой публике они не очень известны, но уже сейчас есть другой подход, когда не обязательно в одной модели соединяются сразу несколько модальностями, то есть сразу несколько видов входящих данных. А когда есть одна модель, скажем, текстовая, которая принимает на вход текст и выдаёт текст, а вторая модель, скажем, звуковая, которая принимает на вход звук и на выходе тоже звук какой -то выдаёт,и ещё есть модели, которые, например, принимают на вход текста и выдают картинку, или наоборот, принимают картинку и выдают описание того, что на этой картинке происходит. То есть различные такие конвертёры, скажем, из одного вида в другой, или же из речи в текст или из текста в речь. Ну, соответственно, вся работа по соединению таких разных систем искусственно -интеллектно между собой сводится к тому, чтобы как кубики Lego подобрать их в таком порядке, чтобы на входе в одну модель и на выходе из неё получался тот формат, который будет понятен на следующем этапе. Скажем, для голосового искусственного интеллекта у нас будет на входе голос, который будет попадать в модель, превращающую голос в текст, и это будет наш первый, так сказать, блок, Lego -блок. Дальше следом за ним будет, поскольку у нас на выходе текст был,после голоса в текст у нас будет модель, которая на вход принимает текст, и на выходе, скажем, тоже даёт текст, например, это будет та же GPT -4, при которой Евгений спрашивает. И на последнем шаге у нас будет модель, которая принимает на вход текст, а на выходе выдаёт речь, аудио. То есть, таким образом, мы получили такую цепочку моделей, когда, имея три различные модели, одна речь в текст, другая текст в текст, и, наконец, третья текст в речь, мы прошли такой полный круг, полный путь от того, чтобы услышать, что какой запрос у нас есть голосовой, сформулировать на него ответ и сказать его обратно голосом в ответ.
То же самое можно производить с аудио -визуальными данными, такими как музыка, например. Есть модели, которые преобразовывают описание музыкального трека, собственно, в музыку, которая подходит под это описание. Есть модели, которые превращают текст в картинки, опять же, путём преобразования, описания картинки, собственно, в пиксели.И есть модели, которые, смотря на пиксели, пытаются понять, что эти пиксели означают, как они соотносятся друг с другом и таким образом как бы распознать, что же на картинке нарисовано или изображено. И дальше уже, имея эту информацию, можно, скажем, опять же, придумать такую модель, такую систему, когда на входе у нас есть, скажем, фотография какой -то надписи на иностранном языке. В середине, ну, и у нас есть модель, которая будет смотреть на эту фотографию, выяснять, что же там написано с использованием распознавания текста, скажем. Дальше у нас будет модель, которая будет, скажем, переводить с одного языка на другой из текстов текст. И на последнем шаге у нас, например, может быть модель, которая текст этот озвучивает, опять же, голосом. И вот у нас получилась такая цепочка, которая позволяет посмотреть на фотографию и на родном языке сказать, что на ней написано, даже если это написано на непонятном нам иностранном языке. Ну, вот таким образом можно соединять разные ИИ между собой.
Но это не единственный способ. Можно пойти немножко дальше.А именно, вот эти языковые модели, что у нас сейчас есть, вот эти ИИ типа GPT -4, они обладают свойством, которое довольно -таки любопытно и отличает этот класс моделей от других моделей, что у нас были до этого. А именно, они могут использовать инструменты. Что это значит? Вот как люди в древности много миллионов лет назад и некоторые животные научились использовать инструменты и из подручных материалов мастерить инструменты, чтобы решать свои задачи. Точно так же языковые модели могут, либо имеют доступ к набору инструментов, либо имеют такую постановку задачи, в которой им говорят, что у них есть вот такого рода инструменты в их распоряжении для решения любых задач, они могут попросить в процессе генерации ответа, они могут использовать эти инструменты, а именно, они могут составить запрос к такому инструменту и посмотреть, что он выдаст в ответе и использовать этот ответ. Как это выглядит на практике? Допустим, есть модель, такая как GPT -4, и мы говорим, что мы хотим, чтобы она посчитала нам, скажем, квадратный корень из какого -нибудь числа. Языковые модели печально известны, как я уже сказал, тем, что они не обладают никаким планированием, они также не обладают никакими вычислительными возможностями сами по себе. Все, что они могут, это, как я уже объяснял, составлять следующее слово, подставлять предложение на основе предыдущего. И, соответственно, если мы попросим такую модель решить квадратный корень из какого -то числа, которого она до этого не видела,то она, скорее всего, не найдет у себя внутри покопавшись, она вот в этой вот дистиллированной из всего интернета массе знаний не найдет конкретно хорошего ответа, который можно было бы подставить в наше уравнение, скажем, и она выдаст первое, что ей придет в голову какой -нибудь неправильный ответ. Это, скорее всего, будет число, которое будет более -менее похоже на число, на которое могло бы быть похож правильный ответ, но, возможно, это будет математически неверный ответ.
Как решить эту проблему? Можно сказать, что вместе с постановкой задачи, когда мы просим ее решить квадратный корень какого -то числа, так же говорим, что, а еще, у тебя есть доступ к калькулятору, и этого достаточно, чтобы в процессе решения модель сформулировала запрос к калькулятору по заранее известному формату этого запроса, по заранее известному протоколу, скажем так, общения с этим калькулятором. Она сформулирует запрос в калькулятор, калькулятор выполнит ее запрос, вернет какой -то результат, и модель дальше вернет этот результат уже в качестве своего ответа, подставит его в свой ответ на то место, на котором должен быть наш результат. Это то, что называется так называемая модель агентов, когда наш ИИ выступает таким агентом, который сам выбирает, когда нужно использовать какой инструмент, и сам решает, какие результаты работы этих инструментов нужно подставить в свой ответ.Это не всегда работает, и иногда и просто игнорирует возможные инструменты, которые у него есть в распоряжении, если ему явно не указать, чтобы не попросить, чтобы он их использовал, а иногда успешно применяет. Так что даже вот с этой моделью агентов результат не гарантирован, но он, как правило, будет лучше, чем если бы языковая модель пыталась, что называется, из головы дать ответ. То же самое касается и каких -то энциклопедических знаний, или знаний о конкретных продуктах или инструментах. Все, что является какими -то специфическими знаниями или требует каких -то вычислений или какого -то планирования, лучше реализовать такую систему с помощью такой агентской модели, когда большая языковая модель будет по сути просто таким связующим клеем между уже готовыми инструментами. Здесь еще возникает интересный вопрос про то, станет ли модель создавать свои собственные инструменты для решения задач. И опять же, Артем видел разные эксперименты в этом направлении, и пока что можно заключить, что если большой языковой модели дать такую установку, а именно сказать, что если ты инструмента такого у себя в инвентаре не видишь, то напиши или создай такой инструмент самостоятельно, как правило, и это сделает, но будем так говорить с подсказкой.
Следующий вопрос от Максима.
Я бы с радостью послушал про опыт использования на работе для решения доменных задач. Всякие, напиши мне CSV2JSON через jq, все понятно, а вот про вот тебе такие условия, и мы хотим вот такой результат, очень мало истории.
Ну, насчет опыта использования на работе, Артем как раз использует именно вот в таком варианте, в котором тут Максим описывает, а именно вот тебе такие условия, или вот тебе такой контекст, и я хочу вот такой результат. Это, наверное, самый частый промпт, самая частая задача, которую Артем ставит искусственному интеллекту большим языковым моделям, потому что это, пожалуй, самый эффективный и простой способ ставить задачи искусственному интеллекту, показывая или рассказывая о входных данных и объясняя, какого рода или какого формата должен быть результат. Тогда искусственный интеллект показывает себя лучше всего при работе в таком формате, потому что и в том виде, что у нас есть, его лучше всего воспринимать не как энциклопизическое такое пособие, не как дистиллят интернета, его лучше всего использовать и применять как думательный движок такой, потому что сила и его новизна не в том заключается, что это выжимка из всех текстов, а в том, что он, прочитав эти тексты и прочитав все программные коды, все исходные коды, что у нас есть,искусственный интеллект научился строить логические цепочки,
но, как я уже говорил, у него нет двух очень важных механизмов, а именно нет планирования встроенного и нет памяти, то есть он не может заранее спланировать шаг за шагом все и делает все это последовательно, от начала до конца, и он не помнит, что он делал или что он видел вне контекста текущей задачи, текущего вопроса, и поэтому вот такая постановка условия, когда мы говорим, вот тебе контекст, вот тебе условия и вот тебе пример результата, мы по сути как раз заполняем вот эти вот пробелы в том, как, скажем так в кавычках, мыслит ИИ, мы даем ему готовую конечную цель, которую он может стремиться, показывая ему пример результата, который мы хотим получить, и мы даем ему условия, то есть такая кратковременная память, с которой он может начать, от которой он может оттолкнуться, потому что если мы попросим его, зададим ему инсокопедического характера вопрос, такой проверка на эрудицию, скажем так, скорее всего он ответит что -то, но велик шанс того, что ответ будет оставлять желать лучшего, поскольку ему не отчего отталкиваться, кроме как от самого вопроса, а если мы ему скажем, например, вот статья из энциклопедии, и скопируем целиком туда всю статью ему в запрос, а теперь из этой, на основе этой статьи, ответь мне на такой -то вопрос,и я хочу ответ увидеть вот в таком -то формате, он должен быть настолько большой, или использовать настолько умные, или наоборот простые слова, или на таком языке и так далее, в общем, описать ему полностью данные, с которыми ему придется работать, а также исходящий результат, тогда и показывает себя лучше всего, он спокойно разберется во всех тонкостях и хитросплетениях такой энцикопедической статьи, или куска документации, которую мы ему показали, и без особых проблем выведет из него верное, скорее всего, решение, или какую -то выжимку, или ответит на наш вопрос, пользуясь этими материалами, именно в том формате, в котором мы его попросим, если мы укажем формат.
То же самое касается таких задач, как, например, написание писем, мы можем просто попросить и написать письмо на заданную тему, но это, скорее всего, даст не очень хороший результат, а вместо этого следует показать ему цепочку писем или письмо, который мы хотим получить ответ, или какой -то контекст, ради которого мы хотим написать письмо, рассказать о чем мы хотим и почему, и указать формат письма, в каком виде мы его хотим, насколько он должен быть профессиональным, или, наоборот, дружеским, какой тон оно должно иметь и так далее, насколько оно большое или маленькое должно быть, сколько там должно быть слов,все это можно заранее указать, и это даст искусственному тиректу точку, в которой он будет в построении своего ответа стремиться. И чем больше мы вот таких полезных, контекстных данных в него засунем, и чем точнее мы опишем финальный результат, который мы хотим, тем лучше будет его процесс мыслей. При этом уже около десятка различных техник есть, разработанных различными специалистами и открытых учеными, и энтузиастами, которые повышают вот такие аналитическо -умственные способности искусственного интеллекта. Одна из техник, которая в ранние месяцы доступа была открыта многими людьми, и которая успешно применяется до сих пор, это техника, которая заставляет ИИ продумывать, вернее, выкладывать свое решение шаг за шагом.
И недавно еще вышло интересное исследование, в котором авторы пытались найти автоматизированный способ улучшения вот таких умственно -аналитических способностей искусственного интеллекта. То есть найти автоматически или полуавтоматически такую фразу, которая заставит интеллект думать лучше, чтобы это не значило в контексте конкретной задачи лучше. И оказалось, что для разных моделей такая фраза разная, но фраза, которая привлекла мое внимание, она подходит для модели Palm2 от Google. Фраза звучит так. Сделай глубокий вдох и продумай решение шаг за шагом.То есть, поставив эту фразу в самый конец своего вопроса к ИИ, исследователи смогли получить 10, а на некоторых задачах даже 15 % прирост в успешных решениях. Казалось бы, зачем искусственному интеллекту делать глубокий вдох, а потом еще и шаг за шагом описывать свое решение, если по факту все, что мы хотим от него, это уже готовый кусок решения без всяких там вздохов и долгих рассусоливаний и хождения вокруг да около. Ответ очень простой.
Почему это работает? Все возвращается к тому, как эти программы работают изнутри, а именно к тому факту, что все, что они делают, это предсказывание следующего слова на основе предыдущего предложения, на основе предыдущих слов. И это касается всего, что происходит внутри этих программ. Больше там ничего не происходит. Все, что они делают, они строят предложения слово за словом. Это значит, что если дать такой программе больше места для разгона, скажем так, больше места, в котором она сможет строить слово за словом, она, скорее всего, построит более логичный и четкий ответ. То есть, что эти инструкции говорят? Сделай глубокий вдох. Это настраивает модель на то, что нужно очень неторопливо составлять предложение, которое будет читаться не как быстрый, первый пришедший в голову, ответ, а как медленное рассуждение с учетом всех факторов.
И вторая часть – это распиши решение шаг за шагом, что, опять же, настраивает модель на то, что это будет не быстрое раз и готово, а это будет долгое и, что самое главное, структурированное выкладка всего решения с объяснением каждого шага. А это, в свою очередь, уже означает, что каждый шаг будет на основе предыдущего. То есть, помня, как работают искусственный интеллект и как работают большие инвестические модели, становится понятно, почему эта техника работает. Потому что, когда в середине решения модель может опираться на то, что она уже начала его с расписывания его по шагам, то есть, каждый следующий шаг будет логически следовать из предыдущего. И когда в итоге мы придем к решению, в конце концов, оно будет основано на всем, что до этого было написано. То есть, скорее всего, оно будет гораздо более логичным и оно будет гораздо более правильным.Но для этого нам пришлось пожертвовать тем, что модели пришлось расписывать все это шаг за шагом и долго и нудно рассуждать о решении до того, как мы в итоге придем к финальному, к финальной точке этого решения. И такого рода техника, как я уже сказал, существует множество, и все они направлены именно на то, чтобы дать модели пространства для размышлений.
И видел Артем еще одну очень спорную и интересную технику, которая звучит так. Мы говорим модели перед тем, как задать вопрос, мы говорим, подумай про себя и не произнося вслух, ответь. И дальше вопрос. То есть, мы пытаемся заставить модель как бы пройти вот этот этап расписывания решений в уме, что, казалось бы, работать не должно. Потому что, как я уже сказал, внутри лингвистических моделей никакого шага планирования и никакой памяти даже кратковременной нет. Все, что там есть, это внимание к предыдущим словам в предложении. То есть, каждое следующее слово будет внимательно подобрано, основываясь на предыдущих словах. А это значит, что, когда мы говорим, подумай про себя и не произноси вслух, видимо, в тренировочных данных, которые видела модель, были такие тексты, внутри которых содержались подобные инструкции. И ответы, внутри которых, либо звучали умнее, либо были более точными, следуя таким инструкциям, что в итоге, видимо, ставит модель в такие условия, когда ей приходится давать более умный ответ, даже без расписывания вот так по шагам. Насколько это хорошо масштабируется или нет, Артем не проверял, но внимательные интересующиеся слушатели могут эту теорию проверить.
Мы, наверное, будем завершать на этом подкаст сегодняшний. Уже полтора часа он длится. Остальные вопросы рассмотрим в следующей части.
Спасибо, что слушали и пока -пока!