Меню категорий
SharesPro
01.06.2020 20:06
0
ИИ может моделировать экономику миллионы раз подряд, чтобы создать более справедливую налоговую политику

Неравенство в доходах является одной из главных проблем экономики. Одним из наиболее эффективных инструментов, которым должны заниматься политики, является налогообложение: правительства собирают деньги с людей в зависимости от того, сколько они зарабатывают, и перераспределяют их либо напрямую, через схемы социального обеспечения, либо косвенно, используя их для оплаты государственных проектов. Но хотя большее налогообложение может привести к большему равенству, слишком большое налогообложение может отговорить их от работы или мотивировать их искать способы избежать оплаты, что уменьшает общий банк.

Добиться правильного баланса нелегко. Экономисты обычно полагаются на предположения, которые трудно проверить. Экономическое поведение людей является сложным, и собирать данные о нем сложно. Поколения экономических исследований занимались разработкой наилучшей налоговой политики, но этот вопрос до сих пор остается открытой проблемой.

Ученые из американской компании бизнес-технологий Salesforce считают, что ИИ может помочь. Во главе с Ричардом Сошером (Richard Socher) команда разработала систему под названием AI Economist, которая использует обучение с подкреплением - тот же метод, что и AlphaGo и AlpahZero от DeepMind - для определения оптимальной налоговой политики для моделируемой экономики. Инструмент по-прежнему относительно прост (нет способа включить все сложности реального мира или человеческого поведения), но это многообещающий первый шаг к совершенно новой оценке политики. 

«Было бы просто замечательно сделать налоговую политику менее политической и основанной на данных», - говорит член команды Алекс Тротт (Alex Trott).

В одном из первых результатов ИИ нашел модель политики, которая - с точки зрения максимизации как производительности, так и равенства доходов - была на 16% более справедливой, чем современная прогрессивная налоговая система, изученная академическими экономистами.  Улучшение по сравнению с текущей политикой США было еще больше. 

«Я думаю, что это совершенно интересная идея», - говорит Блейк ЛеБарон (Blake LeBaron) из Университета Брандейс в Массачусетсе, который использовал нейронные сети для моделирования финансовых рынков.

В симуляции четыре ИИ-работника контролируются своими собственными моделями обучения. Они взаимодействуют с двумерным миром, собирая дерево и камень и обменивая эти ресурсы с другими или используя их для строительства домов, что приносит им деньги.  Рабочие имеют разные уровни квалификации, что приводит их к выбору специализации. Работники с низкой квалификацией учатся лучше, если собирают ресурсы, а работники с более высокой квалификацией учатся лучше, если покупают ресурсы для строительства домов. В конце каждого имитируемого года все работники облагаются налогом по ставке, разработанной политиком, контролируемым ИИ, который использует собственный алгоритм обучения с подкреплением. Цель политика состоит в том, чтобы повысить производительность и доходы всех работников. ИИ сходятся на оптимальном поведении, повторяя симуляцию миллионы раз.

Обе модели обучения с подкреплением начинаются с нуля, без предварительных знаний экономической теории, и учатся действовать методом проб и ошибок - во многом так же, как ИИ DeepMind учатся без участия человека играть в Go и StarCraft на сверхчеловеческих уровнях. 

Можно ли многому научиться на примере только четырех работников ИИ?  Теоретически, да, потому что простые взаимодействия между несколькими агентами вскоре приводят к очень сложному поведению. (Несмотря на всю сложность, в Go по-прежнему участвуют, например, только два игрока.) Несмотря на это, все участники проекта согласны с тем, что увеличение числа рабочих в симуляции будет иметь важное значение, если инструмент предназначен для моделирования реалистичных сценариев.

Игровая система

Двойная доза ИИ является ключевой. Нейронные сети ранее использовались для контроля агентов в моделируемой экономике.  Но превращение политического деятеля в ИИ также приводит к модели, в которой рабочие и политик постоянно адаптируются к действиям друг друга. Эта динамичная среда была проблемой для моделей с усиленным обучением, поскольку стратегия, изученная в рамках одной налоговой политики, может не работать так же хорошо в рамках другой. Но это также означало, что ИИ нашли способы игры в систему. Например, некоторые работники научились избегать налога, снизив свою производительность, чтобы получить право на более низкую налоговую скобку, а затем снова увеличив ее. Команда Salesforce говорит, что такое взаимное отношение между работниками и политиками приводит к симуляции, более реалистичной, чем все, что было достигнуто предыдущими моделями, где налоговая политика обычно фиксирована.

Налоговая политика, которую придумал AI Economist, немного необычна. В отличие от большинства существующих политик, которые являются либо прогрессивными (то есть, более высокие работники облагаются налогом больше), либо регрессивными (более высокие работники облагаются налогом меньше), политика ИИ объединяла аспекты обоих, применяя самые высокие налоговые ставки для богатых и бедных и самые низкие  для работников со средним уровнем дохода. Как и во многих решениях, которые предлагают ИИ, таких как некоторые из выигрышных ходов AlphaZero, результат кажется нелогичным, а не чем-то, что мог бы придумать человек.  Но его влияние на экономику привело к уменьшению разрыва между богатыми и бедными.

Чтобы увидеть, повлияет ли сгенерированная ИИ налоговая политика аналогичным образом на поведение людей, команда проверила ее на более чем 100 краудворкерах, нанятых через механического агента Amazon, которых попросили взять под контроль рабочих в симуляции. Они обнаружили, что политика побуждает людей играть так же, как ИИ, предлагая, по крайней мере теоретически, использовать ИИ-экономиста для влияния на реальную экономическую деятельность.

Бесконечные настройки

Еще одним преимуществом симуляции на основе ИИ является то, что вы можете настраивать параметры для изучения различных сценариев. Например, можно было бы смоделировать воздействие пандемии, добавив такие ограничения, как социальное дистанцирование и ограниченный доступ к ресурсам, или удалив людей из рабочей силы. 

«Трудно придумать оптимальные налоговые теории, основанные на прошлом, если будущее выглядит совсем иначе», - говорит Сошер.

По словам ЛеБарона, способность моделирования к изменению модели является большим плюсом:

«Очень интересно видеть, как работники приспосабливаются к налоговому кодексу».

Это позволяет обойти одну из серьезных критических замечаний в отношении существующих налоговых моделей, в которых поведение обычно фиксируется, говорит он.

Главная оговорка ЛеБарона - небольшое количество агентов, которыми инструмент пока ограничен.

«Есть люди, которые утверждают, что вы можете получить глубокое интеллектуальное понимание с помощью всего лишь нескольких агентов», - говорит он. «Я не один из них».

Он хотел бы, чтобы модель имитировала около 100 работников - это тот же показатель, к которому стремится команда Salesforce.

Но ЛеБарон считает, что этот инструмент уже может быть использован для проверки разумности существующих экономических моделей:

«Если бы я был политиком, я бы запустил эту штуку, чтобы посмотреть, что скажет модель».

Если AI Economist не согласен с другими моделями, это может быть признаком того, что другие модели что-то упустили, говорит он.

Дэвид Паркс (David Parkes), специалист по компьютерам и экономист Гарвардского университета, который сотрудничал с командой Salesforce, также настроен оптимистично.  Он согласен с тем, что им нужно значительно увеличить количество агентов.  Но как только они это сделают и добавят в симуляцию несколько дополнительных функций, таких как компании, он ожидает, что сможет воспроизвести существующие теоретические результаты.

«Тогда это сразу становится полезным», - говорит он.

Дойн Фармер (Doyne Farmer), экономист Оксфордского университета, однако, менее убежден.

Несмотря на то, что он приветствует переход от подкрепляющего обучения к играм в экономику - он считает, что «все сводится к вопросу о том, можете ли вы исследовать политики так же, как AlphaZero играет в Го», - он считает, что пройдет некоторое время, прежде чем инструмент станет действительно полезным. «Реальный мир слишком сложен», - говорит он.

Команда признает, что некоторых экономистов нужно будет убедить. С этой целью они выпускают свой код и приглашают других для запуска своих собственных моделей через него. В долгосрочной перспективе эта открытость также будет важной частью повышения надежности таких инструментов, говорит Сошер.

«Если вы используете ИИ, чтобы рекомендовать определенным людям получать более низкие или более высокие налоги», - подчеркивает он, - «лучше уж объяснить им, почему».

Подписывайтесь на SharesPro в социальных сетях:
Telegram: t.me/sharespro
Instagram: www.instagram.com/sharespro/

Войдите, чтобы оставлять комментарии.

Получить консультацию