Можете ли да кажете разликата между събуждането на Finnegans и пълните глупости?

Ако не сте запознати с веригите на Марков, добре, не се бийте над него. Тяхното най-просто резюме е твърде просто („състояние, което може да се изведе веднага от по-ранно състояние“, благодарение на Wikipedia!) И въпреки това техните приложения в реалния свят са свирепо сложни. Няма много между тях Те са от известно време, но откриха основното разпознаване едва наскоро, тъй като изчислителната мощност най-накрая става достатъчно евтина, за да се изчислят някои огромни, наистина интересни състояния от данни за „без гражданство“.

Едно доста умопомрачително използване на изчисленията на държавата в Марков е шахматният двигател Deep Pink: Той е обучен чисто от „наблюдаване“ на милиарди шахматни движения. Използвайки ги за прогнозиране на силното „следващо състояние“ на шахматната игра, той стана много добър шахматист, без изобщо да бъде програмиран да разбере как се движи всяко едно парче. Технически не знае какво е шах, просто е много добре да предвиди как ще изглежда следващото състояние на шахматната дъска.

Друго спретнато използване на веригите Марков е в генерирането на естествен език. Можете да подадете вдъхновен от Марков езиков генератор куп текст (колкото повече, толкова по-добре) и той ще "предвиди" всякакво количество думи, изречения и абзаци, които може да се появят ". След това наистина няма" не предсказвайте нищо, тъй като текстовите генератори в момента могат да анализират само синтаксис, граматика и речник; смисълът е напълно изгубен за компютъра, така че той идва с текст, който някак звучи като човешки език, но в основата си е безсмислен. Което ме води до Finnegans Wake ...

Ако не сте запознати с Finnegans Wake, не се пребивайте с него. Написан е от световноизвестния романист Джеймс Джойс между 1922 и 1939 г., а английските специалности все още губят нощен сън, опитвайки се да разберат дали това всъщност означава нещо. И не искам да кажа, че по някакъв начин субективист, „Има ли нещо наистина нещо?“, Възпитан при преминаване от лепенки с лакът университетски преподаватели над стърчащи чанти в прашни шезлонги на ръба на кампуса; Искам да кажа, че все още няма буквален консенсус - академичен или по друг начин - дали става въпрос за 600 страници изцяло измислени глупости.

Типичен пасаж от Finnegans Wake

Джойс може би е играл шега на литературната общност или, може би е променил самото определение на романа. Не знаем И възпрепятствайки всяко ново лично откровение, ние никога не можем. Лично се навеждах, за да повярвам на Джойс: Прочитането на няколко пасажа от Събуждане винаги ме завладява, но през нея минава неоспорима, безпогрешна нишка на постоянство. Може да са само две отделни думи един параграф, но винаги изглежда, че нещо ми подсказва, че всяка страница означава нещо по-дълбоко и аз съм готов да дам на автора полза от съмнението.

Докато не го прокарах през генератор на текст на Марков.

Когато преди няколко дни намерих този прост генератор на текст на Марков, почти веднага разбрах, че трябва да го тренирам на Finnegans Wake. Докато анализират Wake, хората се приковават в неща като опит да дешифрират значението зад една от четиридесет и петте букви на Джойс с осемнадесет Zs в него. Но текстов генератор на Марков просто ще го отбележи и ще се движи направо, използвайки го само за да информира хранилището на паметта си, че дългите думи с много Zs са малко по-склонни да се появят. Кодирах програмата на Марков, за да прочета Wake, да анализира резултатите и след това да започна да прогнозирам повече от нейния текст, въз основа на цялата граматика, синтаксис и речник наведнъж. Този тип анализ, някога почти невъзможен, сега отнема само минути.

И когато видях резултатите, почти не повярвах. Не се колебайте да опитате сами да разберете разликата:

В много случаи езиковият генератор всъщност има повече смисъл от оригиналния текст. Изходът, изцяло лишен от смисъл, изглежда равен на оригиналния текст по същество, както и по стил. Гледах как влизат резултатите - не успях да кажа разликата между оригинала и моята продукция повече от 80% от времето - в състояние на неверие. Можете лесно да вмъкнете изхода на компютъра навсякъде в рамките на 600 страници на Wake и практически никой, никой в ​​света не би могъл да разбере.

Можете ли да кажете кой пасаж е от Wake и кой е генериран от компютър?

Значи това го урежда? Дали Джойс беше измама? Текстът му, който сега не се различава от глупостта (за мен, така или иначе), е толкова лишен от разказа, колкото кодът на моята програма? Не толкова бързо.

Аз не съм английски майор, но мога да разпозная няколко неща, които не можем да отнемем от Уейк. Първо, великолепният изобретателен речник е изцяло свой Джойс. Разбира се, моята програма може да е способна да я възпроизведе, но никога не би била в състояние да я измисли. Дори самият роман да е безсмислен, ако намерите смисъл в една дума, тази чест принадлежи изцяло на Джойс.

Второ, дори и намерението на художника по някакъв начин да бъде доказано машинно възпроизвеждано, това не го прави по-малко валиден. Бихме могли да създадем машина, която да рисува като Ван Гог (или със сигурност Поллок), но това не би намалило влиянието, което всяко отделно произведение на изкуството оказва върху неговите наблюдатели. Може би част от намерението на художника е да предаде хаос или дори машинна репликация! Доколкото знам, ако Джойс щеше да се издигне от гроба и да види изхода от моето приложение на Марков, той може да се разсмее, да редактира леко за тема и щастливо да я публикува като Finnegans Wake Part 2: Even Wakier. И това би ли изненадало някого ??

Честно изгубих бележката си кой пасаж е кой; Наистина не знам кой е Джойс и кой е генериран от Марков.

И трето, само защото не мога да кажа разликата между двете около 80% от времето, това не означава, че никой не може. Възможно е да има студенти по литература, които могат да кажат разликата в голяма част от времето. И въпреки че това не би трябвало да повлияе на моето лично мнение за работата, това със сигурност означава, че по-учените учени могат да достигнат до съвсем различно заключение, което правя, дори и при същите данни.

В крайна сметка трябва да призная, че мнението ми за Уейк се промени заради това. Сега съм готов да приема напълно, че вътрешната му сплотеност не е по-трудна за генериране от глупости. Но възхищението ми от него и със сигурност към Джойс всъщност оценяваше.

Ако не друго, той беше марковски генератор 80 години преди изобретяването им.

[Тази статия първоначално се появи на union.io]