Дипломная работа: Разработка автоматизированной информационной системы «Антиплагиат»
Содержание
Введение
1 Анализ и исследование АИС
1.1 Анализ и исследование компьютерных методов выявления плагиата
1.2 Анализ и исследование существующих программ
1.3 Содержательная постановка задачи
1.4 Описание предметной области
1.5 Анализ требований
1.6 Анализ инструментальных средств моделирования и
проектирования
2 Разработка и проектирование АИС «Антиплагиат»
2.1 Конструирование системы с точки зрения поведения
2.2 Проектирование модели с точки зрения процесса
2.3 Визуализация процесса взаимодействия объектов
2.4 Моделирование возможных состояний системы
2.5 Моделирования статического вида системы с точки зрения
развертывания
2.6 Проектирование базы данных
2.7 Разработка логики работы программ и пользовательских интерфейсов
2.8 Разработка алгоритмов обработки запросов пользователей
2.9 Проектирование пользовательского интерфейса
3 Руководство пользователя
3.1 Главная страница
3.2 Руководство пользователя для работодателя
3.3 Руководство пользователя для студента ВУЗа
4 Технико-экономическое обоснование проекта
4.1 Описание работы и обоснование необходимости
4.2 Требования к функциям (задачам), выполняемым системой
4.3 Расчет стоимости работы по разработке АИС «Антиплагиат»
4.4 Цена интеллектуального труда
4.5 Оценка социально — экономических результатов функционирования
АИС «Антиплагиат»
5 Безопасность жизнедеятельности
5.1 Анализ условий труда ЦИТО
5.2Особенности вынужденного движения людей
5.3 Параметры движения людей
5.4 Эвакуационные выходы и пути
5.5 Время эвакуации людей из отдельных помещений и зданий в целом
Заключение
Список литературы
Приложение A Техническое задание
Приложение Б Листинг программы
Анализ и исследование АИС «Антиплагиат»
1.1 Анализ и исследование компьютерных методов выявления
плагиата
Плагиат —
преднамеренное
присваивание авторства чужого
произведения
(науки или искусства), технических решений
или изобретений
[18]
. Плагиат может быть нарушением авторско-правового
законодательства и патентного законодательства и в качестве таковых может
повлечь за собой юридическую ответственность[18]. Но другой стороны,
плагиат возможен и в областях, на которые не распространяется действие
каких — либо видов интеллектуальной собственности, например, в математике и
других фундаментальных научных дисциплинах.
Подражание, заимствование идей (без копирования определенных
технических решений или отрывков произведения, так как сами идеи не могут
являться объектом авторского права), эмуляция и цитирование плагиатом не
являются. Помимо этого от плагиата следует отличать соблюдение канонов и
традиций, работу в рамках стилистических стандартов и использование
шаблонов, с плагиатом не следует путать идейную, художественную или
научную преемственность, развитие или интерпретацию произведений
творчества или интеллектуальной деятельности. Следует понимать, что все
произведения науки и искусства в той или иной степени основаны на ранее
созданных произведениях[18].
Анализ плагиата или выявление плагиата — это компьютерные методы
нахождения плагиата.
Плагиат с появлением Интернета превратился в крупную проблему.
Попав в Интернет, информация становится общественным достоянием ,
блюсти авторское право становится всё тяжелее и даже невозможно.
Постепенно всё труднее идентифицировать первоначального автора.
Быстрое
развитие сети Интернет наряду с
повышающейся
компьютерной грамотностью содействуе
проникновению плагиата в
различные сферы человеческой деятельности: плагиат является острой
проблемой в образовании, промышленности и научном сообществе.
На данный момент времени имеется достаточно большое количество
сервисов и программ, позволяющих различным образом обнаружить плагиат.
Имеется также ряд компьютерных методов обнаружения плагиата.
1.2 Анализ и исследование существующих программ
1.2.1Система «Антиплагиат»
Данная система производит онлайн поиск по тому количеству
документов, которые хранятся в собственной базе. Имеет такие минусы, как:
ограничение проверяемого текста 3000 символами и 5000 символами после
регистрации, сравнивает тексты по предложениям и для того, чтобы его
обмануть, достаточно выбрать одно из четырех действий: добавить в
предложение уникальное слово (хотя бы союз), удалить слово, разбить
предложение на два или объединить два предложения в одно.
1.2.2 Система «Advego Plagiatus»
Разница между остальными подобными системами в том, что Advego
Plagiatus не использует Яндекс. XML (бесплатный сервис, предоставляющий
возможность производить автоматические поисковые запросы к «Яндексу» и
публиковать его выдачу у себя на ресурсе[18]). Программа показывает
пользователю процент совпадения текста и выводит те источники, которые
нашла программа. Программа не преобразует буквы, то
есть, нет
преобразования регистра, нет обработки и изменения латинских букв в
русских словах на аналогичные буквы русского алфавита для текстов на
русском языке[18]. Помимо вышеописанных недостатков отсутствует
поддержка поиска по собственной базе; из — за особенностей работы возникают
ситуации, когда результаты проверки отличаются от раза к разу.
1.2.3 Сервис «www.miratools.ru»
Сервис www.miratools.ru позволяет осуществлять онлайн проверку
текста на плагиат.
Система осуществляет проверку на основе поисковых систем. К
достоинствам относится замена системой английских букв на русские.
Помимо этого имеется возможность изменения длины и шага шингла,
используемого для проверки. На основе результатов проверки система
показывает процент совпадений и найденные источники. Недостатком
является то, что система не работает с собственной базой, существует
ограничение на длину текста в 3000 символов и ограничение на число
проверок в течение суток.
1.2.4 Сервис «www.istio.com»
Сервис www.istio.com совершает проверку текста на наличие
заимствованного содержания с использованием таких поисковых систем, как
Яндекс.XML и Yahoo.com..
Возможности сервиса на порядок хуже, если сравнивать его с Miratools.
По результатам проверки система выдает сообщение о том, является ли текст
уникальным или нет, также показан список подобных страниц сайтов. Сервис
предоставляет дополнительные средства для анализа текстов (проверка
орфографии, анализ наиболее частотных слов и т. д. ). У системы отсутствует
преобразование букв и поиск по собственной базе.
1.2.5 Система «Praide Unique Content Analyser II»
Программа Praide Unique Content Analyser II имеетбольшие
возможности по проверке текстов с использованием поисковых систем.
Пользователю предоставляется возможность выбора используемых
поисковых систем, также программа содержит средства добавления новых
поисковых систем. Проверка текста осуществляется шинглами, длину
которых можно изменить. Можно задавать количество слов перекрытия
шинглов. Программа выводит подробный отчёт по проверке в каждой
поисковой системе. К минусам относится:
отсутствует замены букв,
обработка стоп-слов, нет поддержки работы с собственной базой.
1.2.6 Система « Plagiatinform»
Система Plagiatinform проверяет документы на наличие заимствований,
как в локальной базе, так и в сети Интернет.
Система
производит
поиск плагиата в виде документов,
скомпонованных из «перемешанных» кусков текста нескольких источников.
Проверка может осуществляться посредством быстрого или углублённого
поиска. Результаты проверки происходит посредством показа отчёта. К
недостаткам программы относится отсутствие преобразования букв, не
предоставляется возможность свободного использования или тестирования
системы, то есть, оценить качество её работы невозможно.
1.2.7 Система «Copyscape»
Сервис Copyscape осуществляет поиск копий веб-страниц в Интернете.
Система возвращает список веб-страниц, у которых есть схожий по контенту
текст. Сервис производит проверку на наличие заимствованного контента с
использованием таких поисковых систем , какGoogle и Yahoo.
Проверяется только контент веб страницы, то есть, для выяснения
уникальности текста необходимо опубликовать текст на сайте и ввести в
системе адрес страницы. Без регистрации существует ограничение на
количество проверок в месяц и на количество отображаемых результатов —
10 сайтов. Для зарегистрированных пользователей нет ограничений на
количество проверок и выводимых результатов, но каждый запрос стоит 5
центов.
1.2.8 Результат анализа систем
В результате анализа описанных выше систем можно сказать, что
проверка в одних из них ведется только по контенту веб -страницы, то есть,
для выяснения уникальности текста необходимо опубликовать текст
на сайте и ввести в системе адрес страницы. Также без регистрации
существует ограничение на количество проверок в месяц и на количеств
отображаемых результатов —
10 сайтов. Для зарегистрированных
пользователей нет ограничений на количество проверок и выводимых
результатов, но каждый запрос стоит 5 центов.
Программы же написаны российскими программистами (не считая
стран дальнего зарубежья), ориентированы они на российского потребителя.
1.3 Содержательная постановка задачи
Основное назначение данной системы – проверка дипломных работ на
наличие плагиата, загрузка студентом дипломной работы, проверка
существования (по номеру) данной дипломной работы в БД университета.
Цели создания системы – автоматизация и сокращение времени работы
по проверке на плагиат дипломных работ, автоматизация и сокращение
времени работы на проверку существования дипломной работы с данным
номером.
1.4 Описание предметной области
Предметной областью данной работы является университет и
дипломные работы учащихся в нём студентов.
Для того, чтобы исключить плагиат работ из интернета, покупку чужих
работ и сдачу последних, как своих, необходимо наличие информационной
системы по проверке данных работ.
Для этого необходимо создать такую систему, в которой хранились бы
сведения по дипломным работам, сами работы за предшествующие года.
Необходимо создать такую систему, которая вела бы проверку по данным в
базе на наличие соответствующих работ.
Также необходимо, чтобы работодатель мог по введенному им номеру
диплома получить информацию по данному диплому.
Данная система должна решать следующие задачи:
проверка на плагиат;
проверка существования дипломной работы.
Задача «проверка на плагиат» предназначена для проверки отдельных
глав диплома на наличие плагиата из других дипломных работ и/или плагиата
из интернета.
Задача «проверка существования дипломной работы» предназначена для
проверки наличия данной дипломной работы в университете.
1.5Анализ требований
Бизнес- процесс — это совокупность взаимосвязанных мероприятий или
задач, обращённых на создание определенного продукта или услуги дл
потребителей. Для наглядности бизнес-процессы визуализирую
помощи блок — схемы бизнес -процессов.
Бизнес-процесс: проверка на плагиат:
– загрузка дипломной работы на сервер;
– проверка отдельных глав дипломной работы.
Весь этот процесс осуществляется на основании дипломных работ.
Бизнес-процесс: проверка существования дипломной работы:
– отправка запроса на сервер;
– получение найденной информации.
1.6 Инструментарий
1.6.1 Структурные методы анализа и проектирования ИС
Методология структурного анализа и проектирования ПО устанавливает
руководящие указания для оценки и выбора проекта разрабатываемого ПО,
шаги работы, которые следует выполнить, их последовательность, правила
распределения и назначения операций и методов. Структурные методологии
предлагают методику
передачи
проектных спецификаций в модель
реализации, в будущем используемую при кодогенерации.
Структурные методы являются строгой дисциплиной системного
анализа и проектирования. Структурные методологии жестко регулируют
фазы анализа требований и проектирования спецификаций. Методы
структурного анализа и проектирования стараются преодолеть сложность
крупных систем путем их дифференцирования («черные ящики») и
иерархической организации этих «черных ящиков». Выгода в применении
«черных ящиков» заключается в том, что их пользователю не требуется знать,
как они работают, необходимо знать лишь их входы и выходы, а также
назначение (т.е. функции, которые они выполняет).
Таким образом, первым шагом упрощения сложной системы является ее
дифференциация на «черные ящики», при этом такое разбиение должно
удовлетворять следующим параметрам:
– каждый «черный ящик» обязан осуществлять единственную функцию
системы;
– функция каждого «черного ящика» обязана быть легко понимаема вне
зависимости от сложности ее реализации;
– связь между «черными ящиками» должна вводиться только при
присутствии связи между надлежащими функциями системы;
— связи между «черными ящиками» должны быть простыми, как только
это возможно, для обеспечения независимости между ними.
Второй значительной идеей, лежащей в основе структурных методов,
является идея иерархии. Для понимания сложной системы недостаточно её
дифференцирования, необходимо эти части организовать определенным
образом, а именно в виде иерархических структур.
Кроме того, структурные методы широко применяют визуальное
моделирование, предназначающееся для облегчения понимания сложных
систем.
Структурным анализом обычно называют метод исследования системы,
начинающий с ее общего обзора, который затем детализируется, приобретая
иерархическую структуру со все большим числом уровней. Для таких методов
характерно:
– дифференциация системы на уровни абстракции с ограничением числа
элементов на каждом из уровней (обычно от 3 до 6);
– ограниченный контекст, содержащий лишь существенные на каждом
уровне детали;
– использование жестких формальных правил записи; последовательное
приближение к конечному результату.
В структурном анализе главным методом разбиения на уровни
абстракции является функциональная декомпозиция, заключающаяся в
декомпозиции (разбиении) системы на функциональные подсистемы,
которые, в свою очередь, разделяются на подфункции, те – на задачи и так
далее до конкретных процедур. При этом система сохраняет целостное
представление, в котором все составляющие компоненты взаимоувязаны. При
разработке системы «снизу вверх» от отдельных задач ко всей системе
целостность теряется, возникают проблемы при описании информационного
взаимодействия отдельных компонентов.
1.6.2 Объектно-ориентированные методы анализа и проектирования ИС
Объектно-ориентированный анализ и проектирование – технология
разработки программных систем, в ядро которых положена объектно —
ориентированная методология представления предметной области в виде
объектов, являющихся экземплярами соответствующих классов.
Объектно-ориентированный подход
применяет
объектную
декомпозицию, при этом статическая структура изображается в терминах
объектов и связей между ними, а поведение системы описывается в терминах
обмена сообщениями между объектами.
Основными понятиями объектно-ориентированного подхода являются
объект и класс. Объект — предмет или явление, имеющее четко определенное
поведение и обладающее состоянием, поведением и индивидуальностью.
Структура и поведение схожих объектов определяют общий для них класс.
Класс – это множество объектов, связанных общностью структуры и
поведения.
Целью применения данной методики является выделение объектов,
составляющих организацию, и распределение между ними ответственностей
за выполняемые действия.
В качестве объектов предметной области могут рассматриваться
конкретные предметы, а также абстрактные или реальные сущности. Каждый
объект характеризуется своим состоянием, а также набором операций для
проверки и изменения этого состояния. Каждый объект является
представителем некоторого класса однотипных объектов, определяющего их
общие свойства. Все экземпляры одного и того же класса имеют один и тот же
набор операций и могут реагировать на одни и те же сообщения.
Одним из важных качеств объектного подхода является согласованность
моделей деятельности организации и моделей проектируемой
информационной системы от стадии формирования требований до стадии
реализации. По объектным моделям может быть прослежено отображение
реальных сущностей моделируемой предметной области (организации) в
объекты и классы информационной системы.
1.6.3 CASE – средства визуального моделирования
CASE- технология представляет собой методологию проектирования
информационных систем, набор методов, нотаций и инструментальных
средств, позволяющих в наглядной форме моделировать предметную область,
анализировать модель системы на всех этапах разработки и сопровождения
системы и разрабатывать приложения в соответствии с информационными
потребностями пользователей[6].
В качестве инструментария реализации технологии используются
CASE-средства, основными функциями которых являются:
а) централизованное хранение в единой базе данных проекта
(репозитарии) информации об информационной системе в течение всего
жизненного цикла. Репозитарий может хранить объекты различных типов:
диаграммы, определения экранов и меню, проекты отчетов, описание данных,
логику их обработки, исходные коды программ и т.п.;
б) прямое проектирование программного обеспечения и баз данных.
При этом порядок использования разработчиками CASE — средства следующий:
1) создается логическая модель системы;
2) выбирается конкретный язык программирования или СУБД для
построения физической модели, после чего CASE — средство автоматически
создает физическую модель системы;
3) дорабатывается физическая модель;
4) выполняется автоматическая генерация текста программы или
структуры базы данных на диске;
в) обратное проектирование (реинжиниринг). В этом случае порядок
использования CASE — средства обратный – от текста программы или базы
данных на диске к логической модели. Помимо построения, CASE — средства
позволяют быстро интегрировать полученные таким образом модели в проект,
а также с меньшими потерями переходить от одной физической реализации к
другой (например, в случае ухода «старых» разработчиков, плохо
документирующих программное обеспечение, или появления новых, более
перспективных языков программирования и СУБД);
г) синхронизация моделей системы с ее физической реализацией. В
случае изменения модели системы могут быть автоматически внесены
необходимые изменения в физическую реализацию или наоборот;
д) автоматическое обеспечение качества и тестирование моделей на
наличие ошибок (например, ошибок нормализации БД), полноту и
непротиворечивость;
е) автоматическая генерация документации. Вся документация по
проекту генерируется автоматически на базе репозитария (как правило, в
соответствии с требованиями действующих стандартов). Несомненное
достоинство CASE-технологии заключается в том, что документация всегда
отвечает текущему состоянию дел, поскольку любые изменения в проекте
автоматически отражаются в репозитарии.
Основная цель использования CASE-технологий заключается в
максимальной автоматизации стадий анализа и проектирования систем с
целью построения формальных и непротиворечивых моделей системы.
Ещё одна, не менее важная, цель использования CASE-технологий –
вынесение части деятельност
из стадии кодирования в стади
Большая часть
современных CASE-средств поддерживает
методологии структурного и/или объектно -ориентированного анализа и
проектирования информационных систем[6]. Выбор того или иного подхода
подразумевает следование ему и на стадии кодирования (согласно принципу
концептуальной общности). Их отличие друг от друга заключается в выборе
способа декомпозиции системы (задачи). Если за основу принимается
функциональная (алгоритмическая) декомпозиция, то речь идет о
структурном подходе, если объектная – об объектно-ориентированном.
1.6.4 Интернет-технологии
Интернет-технологии – это различного рода технологии и сервисы,
позволяющие осуществлять всю деятельность в компьютерной сети Интернет.
В основе Интернет-технологий положены гипертексты (тексты с
гиперссылками на другие гипертексты) и сайты, размещаемые либо в
глобальной сети Internet, либо в локальных компьютерных сетях.
При появлении первых компьютеров можно было наблюдать и
появление первых интернет – технологии. Они были разработаны для
взаимодействия компьютеров между собой. Переломным моментом в
развитии этих технологий считается создание Интернета и первого браузера в
начале 90-х годов.
В настоящий момент времени интернет – технологии взаимодействуют
со всеми сферами жизнедеятельности человека, но больше всего они
укрепились в информационной сфере.
Интернет-технологии представляют собой сложную систему
взаимодействия двух составляющих: физической и логической…..