Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС

Инструменты распознавания текстов и компьютерного перевода — 7 КЛАСС

Все статьи
Want create site? Find Free WordPress Themes and plugins.

Урок: Инструменты распознавания текстов и компьютерного перевода

Программы оптического распознавания документов

Очень часто появляется необходимость перевести в электронный вид текст каких-то документов, или даже книг. Можно затратить определённое время и просто набрать этот текст с помощью клавиатуры. Но, чем больше исходный текст, тем больше времени будет затрачено на его ввод в память компьютера.
Поэтому для ввода текстов в память компьютера с бумажных носителей используют сканеры и программы распознавания символов.
После обработки документа сканером получается графическое изображение документа (графический образ). Но графический образ еще не является текстовым документом. Человеку достаточно взглянуть на лист бумаги с текстом, чтобы понять, что на нем написано. С точки зрения компьютера, документ после сканирования превращается в набор разноцветных точек, а вовсе не в текстовый документ.
Проблема распознавания текста в составе точечного графического изображения является весьма сложной. Подобные задачи решают с помощью специальных программных средств, называемых средствами распознавания образов.
Наиболее широко известна и распространена такая программа отечественных производителей — ABBY FineReader.
Эта программа предназначена для распознавания текстов на русском, английском, немецком, украинском, французском и многих других языках (на 179 языках), а также для распознавания смешанных двуязычных текстов.
Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС
Возможности
 программы ABBY FineReader:
  • Работает с разными моделями сканеров.
  • Позволяет из бумажных документов, PDF-файлов и цифровых фото сделать редактируемый текст.
  • Позволяет объединять сканирование и распознавание в одну операцию, работать с пакетами документов (многостраничными документами) и с бланками.
  • Позволяет редактировать распознанный текст и проверять его орфографию.
  • Сохраняет внешний вид документа, а также его структуру, то есть, расположение слов, абзацев, таблиц, изображений, заголовков и нумерация страниц останутся такими же, как и в оригинале.
  • Экспортирует тексты в WordExcelPowerPoint или Outlook.
Преобразование бумажного документа в электронный вид происходит в пять этапов. Каждый из этих этапов программа FineReader может выполнять как автоматически, так и под контролем пользователя. Если все этапы проводятся автоматически, то преобразование документа происходит за один прием.
Пять этапов процесса обработки документа с помощью программы ABBY FineReader:
  1. Сканирование документа (кнопка Сканировать).
  2. Сегментация документа (кнопка Сегментировать).
  3. Распознавание документа (кнопка Распознать).
  4. Редактирование и проверка результата (кнопка Проверить).
  5. Сохранение документа (кнопка Сохранить).
1) На этапе сканирования производится получение изображений при помощи сканера и сохранение их в виде, удобном для последующей обработки. Чтобы начать сканирование, надо включить сканер и щелкнуть на кнопке Сканировать.
2) Второй этап работы — сегментация, разбиение страницы на блоки текста. Если страница содержит колонки, иллюстрации, врезки, подрисуночные подписи или таблицы, то порядок распознавания требует коррекции. Содержимое страницы разбивается на блоки, внутри каждого из которых распознавание осуществляется в естественном порядке. Блоки нумеруются, исходя из порядка включения их в документ. При автоматической сегментации (кнопка Сегментировать) определение границ блоков осуществляется автоматически. При этом учитываются поля документа, просветы между колонками, рамки.
3) Процесс распознавания текста после сегментации начинается с щелчка на кнопке Распознать и полностью автоматизирован.
4) Когда распознавание данной страницы завершается, полученный текстовый документ отображается в окне Текст. Заключительные этапы работы позволяют отредактировать полученный текст с помощью средств, напоминающих текстовый редактор WordPadПровести проверку орфографии с учетом трудностей распознавания позволяет кнопка Проверить.
5) По щелчку на кнопке Сохранить запускается Мастер сохранения результатов. Он позволяет сохранить распознанный текст или передать его в другую программу (например, в Microsoft Word) для последующей обработки полученный текст можно сохранить в виде форматированного или неформатированного документа.

Компьютерные словари и программы-переводчики

Словари необходимы для перевода текстов с одного языка на другой. В настоящее время существуют тысячи словарей для перевода между сотнями языков (англо-русский, немецко-французский и так далее), причем каждый из них может содержать десятки тысяч слов.
В бумажном варианте словарь представляет собой толстую книгу объемом в сотни страниц, где поиск нужного слова является достаточно трудоемким процессом.
Компьютерные словари могут содержать переводы на разные языки сотен тысяч слов и словосочетаний, а также предоставляют пользователю дополнительные возможности.
Возможности компьютерных словарей:
1) Могут являться многоязычными, так как дают пользователю возможность выбрать языки и направление перевода (например, англо-русский, испано-русский и так далее).
2) Могут кроме основного словаря общеупотребительных слов содержать десятки специализированных словарей по областям знаний (техника, медицина, информатика и др.).
3) Обеспечивают быстрый поиск словарных статей: «быстрый набор», когда в процессе набора слова возникает список похожих слов; доступ к часто используемым словам по закладкам; возможность ввода словосочетаний и др.
4) Могут являться мультимедийными, то есть предоставлять пользователю возможность прослушивания слов в исполнении дикторов, носителей языка.
Компьютерные словари:
  • могут быть установлены на компьютер как самостоятельные программы;
  • могут быть встроены в текстовые процессы;
  • существуют в on-line-режиме в сети Интернет.
Для перевода текстовых документов применяются программы-переводчики.
Компьютерные переводчики могут оказать огромную помощь в обработке информации на иностранных языках по различным отраслям знаний.
Инструменты распознавания текстов и компьютерного перевода - 7 КЛАССВ настоящее время наиболее распространенными программами машинного перевода являются системы PROMTStyliusСократMagic Gooddy и другие, которые обеспечивают перевод текстов со многих иностранных языков на русский и с русского языка на иностранные. Эти системы являются не простыми пословными программами перевода, а профессиональными электронными переводчиками, синтезирующими выходной текст на достаточно ясном, грамматически правильном языке с учетом морфологических, синтаксических и семантических связей.
Основные требования к компьютерным переводчикам являются оперативностьгибкостьскорость и точность.
Существуют и минусы компьютерного перевода:
  • иногда допускают смысловые и стилистические ошибки;
  • неприменимы для перевода художественных произведений.

Компьютерные инструменты создания текстовых документов

Текстовый редактор – самостоятельная компьютерная программа (приложение) или часть программного комплекса, которая предназначена для создания и редактирования текстовых данных.

Существуют простые текстовые редакторы и текстовые редакторы с расширенными возможностями (текстовые процессоры).

Текстовые редакторы предназначены в основном лишь для ввода и редактирования текста, но не имеют средств для оформления внешнего вида текста (форматирования). Таким образом, применяются в тех случаях, когда оформление текста является лишним или не нужным (например, при подготовке документов для отправки электронной почтой).
Созданный текстовый файл в одном редакторе можно редактировать с помощью другого редактора, т.к. текстовый файл при сохранении содержит только коды введенных символов.
Кроме создания и просмотра текста текстовые редакторы позволяют выполнять следующие операции редактирования текста – перемещение, копирование, вставка текста, поиск по тексту и замена, сортировка строк, просмотр кодов символов и конвертация кодировок, печать документа и т.п.
Блокнот — удачный пример простейшего текстового редактора.
Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС
Данная программа служит в основном для просмотра и редактирования текстовых файлов, имеющих разрешение *.txt. В «Блокноте» реализуется минимум возможностей для оформления текстового документа.
Текстовый процессор — компьютерная программа, предназначенная для создания и редактирования текстовых документов, компоновки макета текста и предварительного просмотра документов в том виде, в котором они будут напечатаны.

Текстовые процессоры умеют форматировать текст, вставлять в документ графику и другие объекты, не относящиеся к классическому понятию «текст».

Современные текстовые процессоры позволяют выполнять форматирование шрифтов и абзацев, проверку орфографии, создание и вставка таблиц и графических объектов, а также включают некоторые возможности настольных издательских систем.
Текстовые процессоры используют в случаях, когда кроме содержания текста имеет значение и его внешний вид (подготовка официальных документов). Документ, созданный с помощью текстового процессора, содержит кроме текста еще и информацию о его форматировании, которая сохраняется в кодах, не видимых пользователю.
Популярные текстовые процессоры:
1) Microsoft Word — мощный текстовый процессор, предназначенный для создания, просмотра и редактирования текстовых документов.
Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС
2) OpenOffice.org Writer — текстовый процессор, который входит в состав пакета свободного программного обеспечения OpenOffice.org. Writer во многом аналогичен текстовому процессору Microsoft Word, но имеет некоторые возможности, которые отсутствуют в Word (например, поддержка стилей страниц).
Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС
Окна текстовых процессоров имеют типовую структуру. Рассмотрим ее на примере окна текстового процессора Microsoft Word (рис. 2):
  • строка заголовка: строка под верхней границей окна, содержащая имя документа, имя программы и кнопки управления;
  • строка меню: располагается под строкой заголовка, содержащая имена групп команд, объединенных по функциональному признаку;
  • панель инструментов: располагается под строкой меню и представляет собой набор кнопок, которые обеспечивают быстрый доступ к наиболее важным и часто используемым пунктам меню окна;
  • линейка: располагается ниже панели инструментов, которая определяет границы документа;
  • рабочая область: внутренняя часть окна, предназначенная для создания документа и работы с ним;
  • строка состояния: строка, в которой выводится справочная информация.

Технические уровни поддержки

Подготовка текстов — это комплексный процесс, для осуществления которого необходимо наличие:
  1. Аппаратного уровня поддержки;
  2. Программного уровня поддержки;
  3. Пользовательского уровня поддержки.
Аппаратный уровень
Для работы с текстовой информацией в конфигурацию компьютера должны входить устройства ввода информациихранения и обработки информациивывода и передачи информации.
 
К устройствам ввода информации относятся:
  • клавиатура (ввод и корректировка текста);
  • сканер (ввод информации с бумажного носителя в компьютер);
  • цифровой планшет и цифровой фотоаппарат (ввод графической информации);
  • источники готовых изображений (компакт-диски, коллекции изображений в Интернете).Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС
Для хранения и обработки информации используют компьютеры с большим объёмом оперативной памяти и жёсткого диска.
 
К устройствам вывода информации относятся:
  • мониторы (визуальное отображение информации на экране монитора);
  • принтеры (вывод информации из компьютера на бумагу);
  • фотонаборные аппараты (тиражирование текстовых документов).Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС
Программный уровень
Для создания текстовых документов на компьютере устанавливается специальное программное обеспечение. В зависимости от назначения документа и сложности его структуры можно использовать разные программные среды. Набор текста можно выполнить в среде самого простого текстового редактора, иллюстрации подготовить в среде графического редактора.
Текстовый редактор — это прикладная программа для создания и обработки текстовых документов.
Простой текстовый редактор удобен для создания небольших несложных по структуре и оформлению текстов. Таблицы, формулы, схемы, чертежи такой редактор обрабатывать не может.
Пример:
Программа «Блокнот» является простым текстовым редактором. Текстовые файлы, созданные в нём, имеют расширение *.txt. Многие пользователи используют «Блокнот» в качестве простого инструмента для создания Web-страниц.
Текстовый процессор — это текстовый редактор с расширенными возможностями для компьютерной подготовки полноценных документов, от личных писем до официальных бумаг.
Функции текстовых процессоров обычно включают компоновку и форматирование текста, широкие возможности работы с содержанием и страницами, расширенный набор доступных символов, проверку орфографии, внедрение в документ гиперссылок, графики, формул, таблиц и объектов.
Пример:
К текстовым процессорам можно отнести программы:
— Writer, входящий в состав пакета OpenOffice.org;
— Word, входящий в состав пакета Microsoft Office.Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС
Для подготовки буклетов, брошюр, газет, журналов и книг используются мощные профессиональные программные средства — издательские системы.
Настольные издательские системы (НИС) — это программы, предназначенные для профессиональной издательской деятельности, позволяющие осуществлять электронную вёрстку широкого спектра основных типов документов.
Предусмотренные в программных пакетах данного типа средства позволяют:
  • компоновать (верстать) текст;
  • использовать всевозможные шрифты и полиграфические изображения;
  • осуществлять редактирование на уровне лучших текстовых процессоров;
  • обрабатывать графические изображения;
  • обеспечивать вывод документов высокого качества и др.
Пример:
Известными пакетами среди издательских систем для компьютеров являются PageMakerQuarkXPressMicrosoft Publisher и др.

Инструменты распознавания текстов и компьютерного перевода - 7 КЛАСС

Пользовательский уровень

На пользовательском уровне главенствующее положение занимает человек. Каждый человек неповторим, у каждого свой характер, вкус, жизненный опыт. Пользователь вправе сам выбирать удобную, дружелюбную для него как программную среду, так и аппаратное обеспечение.

Did you find apk for android? You can find new Free Android Games and apps.

Добавить комментарий