Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Ввод данных с помощью FineReader



Процесс ввода данных можно частично автоматизировать, для чего необходимо воспользоваться сканером и программой по распознаванию текста. Самой распространенной такой программой является продукт компании ABBYY под названием FineReader. Предпочтительно использовать поздние версии: 5.0, 6.0 или выше.

Процесс оцифровки изображения текста и его распознавания можно условно разделить на ряд макроэтапов:

1. Запуск FineReader

2. Ввод изображения – сканирование. Процесс сканирования в общих чертах похож во всех типах интерфейсов сканеров. Как правило, он состоит из 3 этапов:

Þ Предварительное сканирование – делается с целью определения области сканирования и его параметров (разрешение, муар, цветность и проч.) В случае многостраничного сканирования (одинаковые параметры страницы) первый макроэтап остается одинаковым для всех сканов.

Þ Собственно сканирование – сканирование с рабочими параметрами выделенной области изображения

Þ Экспорт или сохранение полученного изображения данных. В нашем случае осуществляется автоматический экспорт данных в FineReader

3. Сегментация изображения и определения его принадлежности к определенной категории. В нашем случае это таблица

4. Распознавание изображения.


5. Экспорт полученных данных. В нашем случае – это MS Excel. В ячейке С1 «посев на душу населения» необходимо заменить символом x.

Возможно, полученные данные будут нуждаться в правке вследствие ошибок в распознавании. (рис. 1)

Введенный список ранжирован по возрастанию признака x в столбце С рабочего стола программы Excel (Лист 1) величины x изменяются от минимального xmin =0,19(ячейка С2) до максимального xmax =1,95(ячейка

С51). Теперь весь ряд числовых значений x разобьем на десять интервалов и выберем ширину интервала d согласно следующей формулы:

Для вычисления d в ячейку D1 введем формулу: =(F51-F2)/10. Нажмем Enter. После чего в ячейке D1 получим значение d равное 0,176.

Переходим на Лист 2 Excel. В ячейку А1 помещаем символ i, означающий номер интервала, в ячейки – B1 и С1 символ d, в ячейку D1 - символ x , означающий число стоящее в середине i -го интервала, в ячейку Е1 - n , определяющее число губерний попавших в i -й интервал и, наконец, в ячейку F1 – частоту p , т.е. относительную величину ni.

Для автоматического заполнения столбца А (Лист 2) необходимо ввести в ячейку А2 значение 1, в ячейку А3 значение 2. Затем выделить ячейки А2 и А3 и, «ухватившись» курсором за маркер виде черного квадратика (при наведении курсор превращается в черный крестик) в нижнем правом углу выделения, «протащить» выделение до ячейки А11. Эта операция называется автозаполнение ячеек. В данном случае мы задали алгоритм простой последовательности чисел, указав ряд чисел 1, 2.

Теперь нам необходимо создать первую последовательность d, которая представляет собой числовую последовательность и 10 членов, где каждое последующее число больше предыдущего на величину d, а первый член равен 0,19.

Для реализации этого необходимо внести в ячейку B2 значение 0,19, а в B3 формулу: =$B$2+(Лист1!$D$1*Лист2!A2). Примените автозаполнение до ячейки B11. В синтаксисе формулы встречается значок $ -этот условный символ в Excel означает придание свойства неизменности параметру, стоящего после него. Эта неизменность проявляется при использовании функции автозаполнение. Проследив зависимость в формуле, можно понять алгоритм вычислений.

Вторая последовательность d (столбец С) аналогична первой за исключением того, что она начинается со значения 0,366, и ссылка на ячейку в формуле изменилась: =$ С $2+(Лист1!$D$1*Лист2!A2)В на С).

Перейдем к последовательности xi (столбцу значений D). Последовательность будет представлять собой ряд средних арифметических значений из столбцов В и С по строке. Для реализации этого алгоритма внесём в ячейку D2 формулу: =(B2+C2)/2 иприменим автозаполнение до ячейки D11.

Число xi называют статистическим числом, так как оно эквивалентно всем числам попадающим в i -ый интервал. Для вычисления чисел ni (столбец Е) необходимо осуществить счет числа губерний, попадающих в i -ый интервал.

Чтобы осуществить расчет мы воспользуемся алгоритмом, состоящим из нескольких шагов.





Дата публикования: 2015-04-07; Прочитано: 392 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.006 с)...