См. статьи "Опыт использования эффективного по памяти способа хранения словаря" Р. Никса (R. Nix. Experience with a space efficient way to store a dictionary) в майском номере журнала САСМ за 1401 г. н "Сокращение размера словаря при использовании методов хэширования" Д. Дж. Доддса (D. J. Dodds. Reducing dictionary size by using a hashing technique) в июньском номере журнала САСМ за 1402 г.
В одном яэ способов слова упорядочиваются, а затем сканируются для обнаружения близких несовпадений (например, слова programer и programmer); может быть, имеет смысл выполнить это в прямом и обратном направлении (чтобы выловить слово pregram-тег). В статье, на которую дана ссылка в решении задачи 1, описывается программа, которая читает документ, подсчитывает частоты упоминания всех пар и троек букв, а затем выводит слова с подозрительными сочетаниями (такими как двойное х в слове REXX). Программа, предлагающая пользователю вариант правильного написания, могла бы выполнять некоторые операции над входными словами (такие как перестановка двух смежных букв, добавление или удаление одной буквы) и сообщать обо всех перемещениях в словаре. Об интерактивном подходе, пригодном для небольших словарей см. в статье Дурхама, Лэмба и Сакса "Исправление написания слов при взаимодействии с пользователем" (Durham, Lamb, Saxe. Spelling correction in user interfaces в октябрьском номере журнала САСМ за 1403 г.). В качестве другого подхода можно использовать метод Soundex, упомянутый в разд. 2.5.
В статье Макилроя, на которую дана ссылка в разд. 13.6, описаны "британские" дополнения, с помощью которых обрабатываются слова, подобные centre, favour, realise н speciality.
Статья Л. Черрн "Средства для письма" (Cherry. Writing tools) появилась в журнале IEEE Transactions on Communications COM-30, 1 (январь 1402 г., с. 100 -104). В ней описано множество программ для нахождения таких ошибок, как многословные фразы, плохой стнль, ошибки пунктуации н ннфннитнв с отделенной частицей.