Skip to content

Sauron971/WebTableParser-CSharp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Тестовое задание для компании EGAR Technology

Суть задания:

Написать два приложения для парсинга таблицы с сайтов [1] [2]. Таблицы должны сохранятся в формате csv файла, разделителем в котором является таб. в имени результирующего файла должна быть дата и название сайта. Система должна вести логи через библиотеку log4net.

Проделаная работа:

В первом приложении (ParsingAppForWienerborse) была использована библиотека HtmlAgilityPack для получения html разметки страница. Также эта библиотека была использована для получения данных таблицы через ноды с использованием Xpath. После получения коллкций строк(нодов) таблицы, создавались объекты RowTable и записывались в коллекцию List. Запись в csv файл была осуществлена с помощью библиотеки CsvHelper.

В втором приложении (ParsingAppForJSE) была использована библиотека Selenium для получения html разметки страница, потому что таблица на сайте подгружалась позже посредством JS. Также, в случае как с первым приложением, для получения данных из таблицы использовался Xpath через ноды библиотеки HtmlAgilityPack. После получения коллкций строк(нодов) таблицы, создавались объекты RowTable и записывались в коллекцию List. Запись в csv файл была осуществлена с помощью библиотеки CsvHelper.

About

Тестовое задание для компании Egar

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages