Содержание

World Wide GRID- — будущее уже рядом / Habr

ХXI век, возможно, станет эпохой массового внедрения грид-технологий. Счастливое человечество стоит на пороге очередной компьютерной революции, в результате которой произойдет трансформация привычного для нас сегодня WWW (World Wide Web — интернета) в WWG (World Wide GRID — всемирную грид-сеть).

Магическая грид-среда, способная виртуализировать процессоры, память и коммуникации, обещает превратить все компьютерные ресурсы мира в своего рода гигантский мультипроцессор, обладающий практически неограниченными вычислительными возможностями.

Информатизация сегодня выходит на четвертый этап своего развития. Первый был связан с появлением больших компьютеров (мейнфреймов), второй — с персональными компьютерами, третий — с появлением интернета, объединившего пользователей в единое информационное пространство. Первое же десятилетие XXI века, по мнению многих специалистов, знаменуется началом перехода на новые грид-технологии.

Впрочем, конкретные формы и механизмы этого «великого перехода к WWG» пока еще четко не определены. Среди апологетов грид-технологий до сих пор нет единства взглядов относительно того, будет ли WWG создан на базе уже существующих интернет-мощностей или же вообще «в чистом поле» — как универсальная система эмуляции персональных компьютеров, пользователям которой не потребуется ни полнофункционального компьютера, ни собственного программного обеспечения. Масса нерешенных вопросов остается и в области стандартизации протоколов, интеграции разнородных вычислительных ресурсов, обеспечения безопасности хранения и передачи данных.

Суперкомпьютер из розетки

Грид-компьютинг начал формироваться прежде всего как интегратор вычислительных ресурсов для решения различных «ресурсоемких» научных задач. Идея более эффективного использования вычислительных мощностей путем соединения множества компьютеров в единую структуру возникла в научном сообществе сравнительно давно — в эпоху мейнфреймов (больших ЭВМ). Уже в 80е годы ученые (прежде всего физики-ядерщики) для решения сложных математических задач пытались комбинировать друг с другом различные рабочие станции и использовать свободные центральные процессоры для сокращения времени обработки.

В 1994 году стартовал проект создания всемирной компьютерной сети GLORIAD (аббревиатура от Global Ring Network for Advanced Application Development, Глобальная кольцевая сеть для развития прикладных исследований) — волоконно-оптического кольца в Северном полушарии, объединяющего вычислительные ресурсы различных научно-исследовательских организаций США, Канады, Европы, России, Китая и Южной Кореи (опять-таки главным образом физических центров). Россия присоединилась к этому проекту в 1996 году, и сегодня нашу страну в нем представляют Российский научный центр «Курчатовский институт» и Российский НИИ развития общественных сетей.

Тем не менее формально авторами концепции грид считаются Ян Фостер из Арагонской национальной лаборатории Чикагского университета и Карл Кессельман из Института информатики Университета Южной Калифорнии. Именно Фостер и Кессельман в 1998 году впервые предложили термин grid computing для обозначения универсальной программно-аппаратной инфраструктуры, объединяющей компьютеры и суперкомпьютеры в территориально-распределенную информационно-вычислительную систему. Согласно их ставшему уже классическим определению, «Грид (grid) — согласованная, открытая и стандартизованная среда, которая обеспечивает гибкое, безопасное, скоординированное разделение ресурсов в рамках виртуальной организации».

Термин grid computing был введен по аналогии с термином power grid (электросеть).

Пользователи компьютерных мощностей получат возможность прямого подключения к удаленной вычислительной сети (так же как к электроэнергии через бытовые розетки), не озадачиваясь вопросом, откуда именно приходят требуемые для работы вычислительные ресурсы, какие для этого используются линии передачи и т. п.

Основные ресурсные элементы грид-систем — суперкомпьютеры и суперкомпьютерные центры, а важнейшая инфраструктурная составляющая — высокоскоростные сети передачи данных.

Суперкомпьютеры, не объединенные в территориально-распределенную систему, обладают как минимум тремя существенными недостатками. Во-первых, это очень дорогостоящая техника, которая быстро морально устаревает (суперкомпьютеры из первой сотни рейтинга Top-500 уже через два-три года, как правило, оказываются в самом хвосте этого списка или вообще выпадают из него). Во-вторых, это «статичность» вычислительных мощностей суперкомпьютеров, которые практически не поддаются серьезной модернизации, зачастую она не позволяет использовать их для решения задач нового уровня сложности. И, наконец, третий «большой минус» — низкий КПД суперкомпьютеров вследствие неравномерности загрузки CPU.

В идеале от этих недостатков можно избавиться при объединении суперкомпьютеров в грид-сеть. Однако для эффективной эксплуатации грид-систем вначале необходимо прийти к консенсусу в сфере стандартизации (определение стандартов сервисов, интерфейсов, баз данных и т. д.).

Распределение вычислительных сред

Авторы идеи грид-компьютинга Фостер и Кессельман стояли и у истоков разработки первого стандарта конструирования грид-систем, свободно распространяемого программного инструмента с открытым кодом Globus Toolkit.

Для дальнейшего развития Globus Toolkit в 1999 году была создана специальная организация Global Grid Forum (GGF), в которую наряду с академическими организациями вошли многие производители компьютерных систем и программного обеспечения.

В 2002 году GGF и корпорацией IBM в рамках версии Globus Toolkit 3.0 была представлена новая системная разработка Open Grid Services Architecture (OGSA), инкорпорировавшая в грид понятия и стандарты веб-сервисов. В этой архитектуре грид-сервис определяется как специальный тип веб-сервиса, благодаря чему становится возможной работа с ресурсами грид на базе стандартных интернет-протоколов.

В настоящее время адаптацией Globus Toolkit к своим основным продуктам, использующим технологию бизнес-вычислений, активно занимаются ведущие игроки компьютерного рынка, в частности та же IBM и два кита ERP-технологий, Oracle и SAP.

В то же время помимо наиболее популярного сегодня проекта Globus параллельно разрабатываются и другие грид-стандарты — например, Legion, Condor и Unicore. Так, в 2004 году у GGF появился новый серьезный конкурент — консорциум Enterprise Grid Alliance (EGA), в который в числе прочих вошли такие «монстры», как Fujitsu Siemens Computers, Hewlett-Packard, Intel, NEC, Oracle, Sun Microsystems, EMC.

Причем если основной задачей GGF была выработка требований к грид для производителей ИТ-решений, то EGA изначально была «заточена» под удовлетворение запросов корпоративных пользователей.

В конце июня 2006 года GGF и EGA, которые успели порядком попортить друг другу нервы, официально объявили о своем слиянии и создании открытого Форума по распределенным вычислениям (Open Grid Forum, OGF). Как отметил новоиспеченный президент и исполнительный директор OGF Марк Линеш, ранее занимавший пост председателя совета директоров GGF, «этот шаг позволит консолидировать сообщество сторонников идей грид и более эффективно сотрудничать с основными участниками этого рынка в разных странах. Мы сможем выступать единым фронтом во всех вопросах, связанных с разработкой и внедрением грид и распределенных вычислительных сред».

Разумеется, это счастливое слияние еще не означает, что всеобщая стандартизация грид-технологий — теперь дело решенное. Одной из серьезнейших преград на пути победоносного распространения грид-сетей была и остается традиционная модель лицензирования ПО, согласно которой клиенты платят в зависимости от числа процессоров, на которых работает приложение. Грид фактически уничтожает эту модель, так как внутри грид-сети ни один центральный процессор не имеет устойчивой связи с определенным приложением.

До сих пор ни один поставщик ПО открыто не объявил о намерении изменить свою модель расчета цены с учетом новой специфики grid computing.

Еще один «провисающий» элемент глобальной грид-конструкции — практически полное отсутствие стандартизации коммерческого программного обеспечения грид. Дело в том, что одна из характеристик ранних приложений для grid computing (используемых в научных вычислениях) — независимость одной выполняемой задачи от результата решения другой. Например, в больших грид-приложениях для сложных математических расчетов вычисления разбиваются на независимые части, которые в любое время могут быть «сложены». Однако многие корпоративные приложения жестко зависимы: одно вычисление или процесс не может продвигаться до тех пор, пока не закончится другое.

По мнению Яна Фостера, «подходы на основе открытых стандартов (подобные Globus Toolkit) в конечном счете превратят грид в господствующее направление развития корпоративных информационных инфраструктур», но давать точные прогнозы относительно времени наступления этого «корпоративного ИТ-перелома» эксперты пока не рискуют.

Поиски внеземного разума

Намного успешнее продвигаются грид-технологии в научно-образовательной сфере, что в значительной мере объясняется активной финансовой поддержкой разнообразных грид-проектов государственными структурами.

Грид-сети сегодня используются в самых разных фундаментальных научных исследованиях и проектных работах. Эволюция протопланетного вещества, планет и Земли, геномика и протеомика, общее метеорологическое прогнозирование и прогноз различных стихийных бедствий (цунами, землетрясений, извержений вулканов), моделирование и анализ экспериментов в ядерной физике, ядерное оружие, нанотехнологии, проектирование аэрокосмических аппаратов и автомобилей т. д. — наверное, скоро проще будет назвать научную дисциплину, где суперкомпьютеры и распределенные вычисления еще не применяются.

Поэтому далее мы ограничимся лишь перечнем наиболее серьезных грид-проектов, уже осуществленных за последние несколько лет или находящихся в стадии реализации.

В 2001 году в США стартовал проект TeraGrid, финансируемый Национальным научным фондом науки (NSF), основной задачей которого стало создание распределенной инфраструктуры для проведения высокопроизводительных (терафлопных) вычислений.

В мае 2004 года Европейским союзом был создан аналог американской TeraGrid — консорциум DEISA (Distributed European Infrastructure for Supercomputing Applications),

частично финансируемый в рамках программы 6th Framework, который объединил в грид-сеть ведущие национальные суперкомпьютерные центры ЕС.

В конце марта 2004 года завершился трехлетний проект European DataGrid (EDG), в рамках которого была построена тестовая инфраструктура вычислений и обмена данными для нужд европейского научного сообщества.

На основе этих наработок был начат новый международный проект организации высокопроизводительной грид-сети Enabling Grids for E-sciencE (EGEE), который выполняется под руководством швейцарского ЦЕРНа (Европейского центра ядерных исследований, Женева) и финансируется Европейским союзом и правительствами стран-участниц. В настоящее время в проект входят 70 научных учреждений из 27 стран мира, объединенных в 12 федераций. В рамках этого проекта должен быть построен самый крупный в мире грид с суммарной вычислительной мощностью 20 000 CPU.

Ведущая роль ЦЕРНа определяется тем, что в 2007 году там планируется запуск крупнейшего в мире ускорителя элементарных частиц (LHC, большого адронного коллайдера), который будет источником огромного объема информации. Создающаяся в первую очередь под LHC новая компьютерная инфраструктура должна будет обеспечить эффективную обработку информации, ожидаемый среднегодовой объем которой оценивается в 10 петабайт (1 петабайт = ~10 15 байт). Задача EGEE, однако, далеко не ограничена ядерной физикой и состоит в том, чтобы реализовать потенциал грид и для многих других научно-технологических областей. Так, в ближайших планах руководства проекта создание отдельного биоинформационного «грид-блока».

В тесном взаимодействии с проектом EGEE развивается и магистральная европейская сеть для образования и науки — GEANT. В середине прошлого года межправительственная организация DANTE объявила о запуске научно-образовательной сети нового поколения GEANT 2, которая охватывает 3 млн пользователей из 3,5 тыс. академических учреждений, расположенных в 34 европейских государствах (в том числе и в России). Новая сеть качественно изменит обработку информации радиоастрономических комплексов, регистрирующие системы которых расположены на значительном удалении друг от друга, а также будет обслуживать часть процессов по передаче данных после запуска LHC.

Под руководством Пенсильванского университета США на базе грид-технологий создан Национальный цифровой центр маммографии с общим объемом данных (маммограмм) 5,6 петабайта, который предоставляет медикам возможность мгновенного доступа к записям миллионов пациентов.

Стоит упомянуть и о проекте [email protected], инициированном астрономами Университета Калифорнии — Беркли. В рамках этого проекта была создана виртуальная грид-сеть, которая регулярно анализирует данные, поступающие с радиотелескопа Arecibo в Пуэрто-Рико с целью поиска внеземного разума. Посредством интернета SETI объединил вычислительную мощность более 5 млн персональных компьютеров и уже проделал вычислительную работу, эквивалентную более чем 600 тыс. лет работы ПК (правда, до сих пор никакой информации о найденных инопланетянах от координаторов проекта еще не поступило).

Китай начинает и может выиграть

Соединенные Штаты сегодня — безусловный мировой лидер по части практического строительства грид-сетей. В 2004 году Джордж Буш официально объявил о начале работы президентской стратегической GRID-программы (Strategic Grid Computing Initiative), основной целью которой является «создание единого национального пространства высокопроизводительных вычислений» (National High Performance Computing Environment).

К настоящему времени в США уже успешно функционируют четыре национальные грид-сети, находящиеся под заботливой опекой ключевых государственных ведомств: компьютерная сеть национального фонда научных исследований (NSF Comp. Grid), информационная сеть поддержки НАСА (NASA Information Power Grid), глобальная информационная сеть министерства обороны (DOD GI Grid) и сеть суперкомпьютерной инициативы министерства энергетики (DOE ASCI Grid).

Свою немалую лепту в процесс «всеобщей гридизации» вносят и частные американские компании. Весьма оригинален проект Sun Grid компании Sun Microsystems, стартовавший в прошлом году: машинное время сети центров обработки данных, содержащей суммарно около 10 тыс. процессоров, сдается компанией в аренду с оплатой из расчета 1 доллар за пользование одним процессором в час. Продажа времени Sun Grid осуществляется компанией по договору через чикагскую электронную фондовую биржу Archipelago Holdings. Через нее же покупатель может продать неиспользованные часы. Дополнительно в Sun предлагают услуги хранения данных по цене 1 доллар за гигабайт в месяц. Услуга предлагается организациям, имеющим эпизодические потребности в значительных вычислительных мощностях.

Концепция грид-компьютинга компании Oracle предполагает использование грид-сети как универсальной системы управления данными на основе базы данных Oracle 10G. Специальная функция ASM (Automatic Storage Manager) позволяет виртуализировать наборы дисков в единый виртуальный диск с возложением на Oracle функций менеджера файлов и томов. Oracle сама работает с этой группой дисков (виртуальными дисками), размещая на них свои файлы и управляя ими. Oracle разбивает все пространство этого виртуального диска на равные кусочки размером в 1 Мб и создает из кусочков виртуальные файлы БД, табличные пространства, тома и т. д.

Особняком в длинном списке грид-проектов стоит проект построения глобальной грид-системы, продвигаемый корпорацией Google. Модель Google — это превращение компьютинга в потребительскую услугу по типу электроснабжения (что во многом перекликается с идеей, реализуемой Sun Microsystems). В определенном смысле Google возвращается к архитектуре большой ЭВМ. В рамках этого проекта все компьютерные устройства (ПК, мобильный телефон, телевизор и т. п.) становятся просто терминалами, которые будут включены в серверный грид Google с услугами приложений.

Иными словами, Google сегодня пытается позиционировать себя в качестве универсальной системы доставки приложений на любое устройство в любой точке мира и тем самым стать реальной альтернативой привычного персонального компьютера. Стратегически важное конкурентное преимущество проекта Google — понижение себестоимости обработки бита информации. Для решения этой задачи Google активно продвигается в формировании корневой транспортной системы и подготовке площадей для размещения огромных серверных ферм с прямым выходом к ведущим мировым телекоммуникационным операторам. (По неподтвержденной информации, в 2005 году в условиях повышенной секретности Google провел крупномасштабную работу по установке в различных точках мирового океана 4 тыс. морских контейнеров с серверными стойками CPU.) Это позволит компании существенно сократить телекоммуникационные расходы и обеспечить контроль над доставкой большей части контента и мировым интернет-трафиком.

Комментируя операции Google, один из ведущих российских экспертов в области грид-технологий Владимир Рубанов в беседе с корреспондентом «Эксперта» отметил: «Финансовый результат от этих усилий “гугловцев” уже налицо: если еще в декабре 2004 года рыночная капитализация Google составляла 28 миллиардов долларов, то уже в декабре 2005го она возросла до 138 миллиардов! Этот рост наглядно демонстрирует, насколько укрепилась на Западе вера в перспективы грид-технологий. Иными словами, крупный бизнес сегодня делает большую ставку на развитие этих технологий и готов вкладывать в них колоссальные финансовые ресурсы».

Большое внимание грид-технологиям в последние годы уделяет и руководство Евросоюза, серьезно озабоченного наметившимся отставанием в этой области от США. В 2005 году Еврокомиссия подготовила специальную программу стоимостью 13 млрд евро, в рамках которой грид-компьютингу отводится роль стимулятора и важнейшего ресурса для превращения Евросоюза в «самую конкурентоспособную в мире экономику знаний».

C 2000 года ведутся работы по освоению грид-технологий и в Китае. Долгое время информация о том, на какой стадии находится реализация проекта ChinaGrid, была фактически засекречена. Информационная бомба взорвалась в середине июля 2006 года, когда китайские СМИ во всеуслышание объявили о завершении работы над Китайским образовательным грид-проектом (China Educational Grid Project, CEGP).

CEGP объединил компьютерные сети нескольких десятков крупнейших университетов страны и предоставил миллионам китайских студентов прямой доступ к базам данных, онлайновым учебным курсам и сервисным приложениям по самым разным направлениям и дисциплинам.

Как полагает Владимир Рубанов, «китайцы уже создали материальную и инфраструктурную базу для рывка в образовательной сфере. Им теперь уже не нужно регулярно тратить тысячи долларов на покупку новых компьютеров взамен устаревших — достаточно приобрести всего за 150–200 долларов интернет-коммуникаторы (PIC) и получать далее все необходимые ресурсы из грид-сети. Например, подключиться к реализации Программы 50–15, активно продвигаемой сегодня американской компанией AMD (обеспечить к 2015 году доступ в интернет при помощи дешевых интернет-приставок для 50% населения Земли. — “Эксперт”)».

В январе 2006 года в Афинах было официально объявлено о начале выполнения финансируемого Европейской комиссией проекта EUChinaGRID. Главная его цель — объединение европейских и китайских грид-инфраструктур для повышения эффективности совместного использования различных научных приложений, работающих в грид-среде. Наметившийся стратегический альянс ЕС и Китая вполне можно рассматривать как одну из первых попыток создания сильного «грид-противовеса» претензиям США на мировое лидерство в этой крупномасштабной технологической гонке.

В скором времени к этому альянсу может подключиться и Индия, которая также объявила о начале реализации собственной Национальной грид-компьютинговой инициативы GARUDA, предусматривающей объединение в грид-сеть 17 крупнейших научно-исследовательских центров страны.

Зеленый свет для русского грид

К настоящему времени национальные программы по развитию грид-технологий в той или иной форме реализуются практически всеми технологически развитыми странами. В России такой программы по грид до сих пор нет.

Вплоть до середины этого года все, чем могла похвастаться в сфере государственной поддержки развития грид-технологий Россия, по сути ограничивалось двумя ведомственными программами — Минатома и Российской академии наук, принятыми еще в 2003 году.

В июне 2006 года правительство России наконец одобрило предложение Министерства образования и науки о разработке проекта новой суперкомпьютерной программы «СКИФ-ГРИД» Союзного государства России и Белоруссии. Распоряжением Михаила Фрадкова от 7 июня Минобрнауки было поручено внести предложение о разработке проекта программы «Разработка и использование программно-аппаратных средств ГРИД-технологий и перспективных суперкомпьютерных вычислительных систем семейства СКИФ» в совет министров Союзного государства.

Благодаря этому решению головные разработчики суперкомпьютеров семейства СКИФ — Институт программных систем Российской академии наук (ИПС РАН) в Переславле-Залесском и Объединенный институт проблем информатики Национальной академии наук Белоруссии (ОИПИ НАН Белоруссии) — наконец получили добро на проведение дальнейших исследований.

Однако даже этот проект, предусматривающий в течение ближайших нескольких лет создание старших моделей персональных кластеров-серверов, имеет лишь косвенное отношение к грид-технологиям. Персональные кластеры-серверы — объединения вычислительных мощностей компьютеров и суперкомпьютеров внутри высокоскоростной локальной сети, — несмотря на целый ряд безусловных преимуществ по сравнению с «обычными» суперкомпьютерами, гомогенны (состоят из систем, имеющих одинаковую базовую структуру). В этом заключается их принципиальное отличие от компьютерных грид-сетей, которые позволяют объединять в единую вычислительную цепь гетерогенные вычислительные ресурсы, формально не связанные общим ПО и не требующие централизованного администрирования.

Мощности глобальной новой грид-системы будут такими, что — по крайней мере в теории — у ее координаторов появится возможность отслеживать и анализировать любой «клик мышкой» на каждом отдельно взятом компьютере, подключенном к грид-сети. А это — прямая дорога к перехвату интеллектуальной собственности, к быстрой утечке идей и т. п.

По мнению г-на Рубанова, единственным разумным ответом на вызов такой глобальной грид-инфраструктуры должно стать «построение национальной грид-сети, которую мы сделаем целостной и управляемой, взаимодействующей по определенным правилам с глобальной, — иными словами, между национальной и глобальной грид-инфраструктурой должна быть создана контролируемая зона обмена информацией».

Для создания такой национальной грид-системы необходимо наличие трех важнейших компонентов: программных продуктов, вычислительных мощностей и коммуникаций. Причем самым критическим элементом этой новой инфраструктуры сегодня являются именно коммуникации.

Все реализуемые сегодня концепции и подходы к построению глобальной грид-системы (грид как вычислительная услуга — Sun Microsystems; грид как система эмуляции персонального компьютера и его замены интернет-коммуникатором — AMD; грид как единая операционная система, объединяющая вычислительные мощности в глобальный суперкомпьютер, — Google; грид как виртуальная организация, формирующая однородное пространство ИКТ-взаимодействия, — Oracle) требуют высокоскоростных сетей.

Создание выделенной высокоскоростной сети передачи данных для грид-систем — это ключевой элемент снижения себестоимости обработки бита информации и главное преимущество в ценовой конкуренции глобальных проектов. И именно участие в создании коммуникационной инфраструктуры для глобального грид-компьютинга — возможно, последний шанс для достойного включения России в преобразование мирового инфокоммуникационного пространства.

— по материалам Эксперт`а —

habr.com

Грид-вычисления — Национальная библиотека им. Н. Э. Баумана

Материал из Национальной библиотеки им. Н. Э. Баумана
Последнее изменение этой страницы: 20:16, 18 мая 2017.

Многозадачный сервер для вычислений.

Грид-вычисления (англ. grid — решётка, сеть) — это форма распределённых вычислений, в которой «виртуальный суперкомпьютер»[1][Источник 1]

Гетерогенные вычислительные системы — электронные системы, использующие различные типы вычислительных блоков, работающих вместе для выполнения огромного количества заданий (операций, работ). Эта технология применяется для решения научных, математических задач, требующих значительных вычислительных ресурсов. Грид-вычисления используются также в коммерческой инфраструктуре для решения таких трудоёмких задач, как экономическое прогнозирование, сейсмоанализ, разработка и изучение свойств новых лекарств.

Грид с точки зрения сетевой организации представляет собой согласованную, открытую и стандартизованную среду, которая обеспечивает гибкое, безопасное, скоординированное разделение вычислительных ресурсов и ресурсов хранения информации, которые являются частью этой среды, в рамках одной виртуальной организации[2].

Грид-вычисления можно организовать на базе множества устаревших моделей персональных компьютеров [3] объединённых в иерархическую локальную вычислительную сеть Ethernet [4] с присутствием серверов. Эта сеть может иметь соединение с интернетом.

Сравнение грид-систем и обычных суперкомпьютеров

Распределённые, или грид-вычисления, в целом являются разновидностью параллельных вычислений, которое основывается на обычных компьютерах (со стандартными процессорами, устройствами хранения данных, блоками питания и т. д.), подключенных к сети (локальной [5] или глобальной [6]) при помощи обычных протоколов, например Ethernet. В то время как обычный суперкомпьютер [7] содержит множество процессоров, подключенных к локальной высокоскоростной шине.[Источник 2]
Основным преимуществом распределённых вычислений является то, что отдельная ячейка вычислительной системы может быть приобретена как обычный неспециализированный компьютер. Таким образом можно получить практически те же вычислительные мощности, что и на обычных суперкомпьютерах, но с гораздо меньшей стоимостью.

Технология облачных вычислений

Феномен облачных вычислений объединяет несколько различных концепций информационных технологий и представляет собой новую парадигму предоставления информационных ресурсов (аппаратных и программных комплексов).
Со стороны владельца вычислительных ресурсов облачные вычисления ориентированы на предоставление информационных ресурсов внешним пользователям. Со стороны пользователя, облачные вычисления — это получение информационных ресурсов в виде услуги у внешнего поставщика, оплата за которую производится в зависимости от объема потребленных ресурсов согласно установленному тарифу. Ключевыми характеристиками облачных вычислений являются масштабируемость и виртуализация.

  • Масштабируемость представляет собой возможность динамической настройки информационных ресурсов к изменяющейся нагрузке, например к увеличению или уменьшению количества пользователей, изменению необходимой емкости хранилищ данных или вычислительной мощности. Виртуализация, которая также рассматривается как важнейшая технология всех облачных систем, в основном используется для обеспечения абстракции и инкапсуляции.
  • Абстракция позволяет унифицировать «сырые» вычислительные, коммуникационные ресурсы и хранилища информации в виде пула ресурсов и выстроить унифицированный слой ресурсов, который содержит те же ресурсы, но в абстрагированном виде. Они представляются пользователям и верхним слоям облачных систем как виртуализованные серверы, кластеры серверов, файловые системы и СУБД.[Источник 3]
  • Инкапсуляция приложений повышает безопасность, управляемость и изолированность. Еще одной важной особенностью облачных платформ является интеграция аппаратных ресурсов и системного ПО с приложениями, которые предоставляются конечному пользователю в виде сервисов.

Ссылки/литература

Примечания

  1. ↑ Суперкомпью́тер (с англ. — «Supercomputer», СверхЭВМ, СуперЭВМ, сверхвычисли́тель) — специализированная вычислительная машина, значительно превосходящая по своим техническим параметрам и скорости вычислений большинство существующих в мире компьютеров представлен в виде кластеров, соединённых с помощью сети, слабосвязанных гетерогенных компьютеров.
  2. ↑ В грид-технологиях, виртуальная организация представляет собой группу людей или организаций, разделяющих между собой вычислительные, дисковые, информационные и сетевые ресурсы грида в общих целях.
  3. ↑ Персональный компьютер, ПК (англ. personal computer, PC), ПЭВМ (персональная электронно-вычислительная машина) — настольная микро-ЭВМ, имеющая эксплуатационные характеристики бытового прибора и универсальные функциональные возможности.
  4. ↑ Ethernet (ˈiːθəˌnɛt от англ. ether ˈiːθə — «эфир» и англ. network — «сеть, цепь») — семейство технологий пакетной передачи данных для компьютерных сетей.
  5. ↑ Лока́льная вычисли́тельная сеть (ЛВС, локальная сеть; англ. Local Area Network, LAN) — компьютерная сеть, покрывающая обычно относительно небольшую территорию или небольшую группу зданий (дом, офис, фирму, институт). Также существуют локальные сети, узлы которых разнесены географически на расстояния более 12 500 км (космические станции и орбитальные центры). Несмотря на такие расстояния, подобные сети всё равно относят к локальным.
  6. ↑ Глобальная сеть — любая сеть связи, которая охватывает всю Землю. Термин, используемый в данной статье, относится в более узком смысле к двунаправленным сетям связи, а также базе технологий сетей.
  7. ↑ Суперкомпью́тер (с англ. — «Supercomputer», СверхЭВМ, СуперЭВМ, сверхвычисли́тель) — специализированная вычислительная машина, значительно превосходящая по своим техническим параметрам и скорости вычислений большинство существующих в мире компьютеров.

Источники

  1. ↑ Ian Foster, Carl Kesselman, Steven Tuecke The Anatomy of the Grid: Enabling Scalable Virtual Organizations // International Journal of High Performance Computing Applications — 2001. — Август (дата обращения: 09.03.2017).
  2. ↑ Conference GlobusWORLD 2005 Grid Security: Grid Perspective// (дата обращения: 09.03.2017).
  3. ↑ Security for Grid Services // Twelfth International Symposium on High Performance Distributed Computing (HPDC-12). — IEEE Press, 2003 (дата обращения: 09.03.2017).

ru.bmstu.wiki

Грид-системы и потенциал их использования

Аннотация.  В  данной  статье  проведен  краткий  обзор  некоторых  аспектов    построения и применения грид-систем с целью дать представление об этой технологии. Для демонстрации потенциала использования данной технологии, приведен перечень существующих проектов, использующих грид-системы. 

На сегодняшний день учёные нуждаются в огромных вычислительных мощностях для решения широкого спектра задач, находящихся на фронте современной науки. Исследование свойств белка, исследование результатов работы адронного коллайдера, прогнозирование изменения климата, решение математических проблем, а также эффективный поиск лекарств, гравитационных волн и внеземного разума проводятся сегодня с использованием суперкомпьютеров. Производительность таких машин огромна. В качестве примера можно привести мощнейший на сегодня суперкомпьютер Tianhe-2, работающий в Национальном институте оборонных технологий в Китае.

Достигнута пиковая производительность Tianhe-2 – 33,86 петафлопс, что почти в 2 раза больше, чем у Titan, занимающего второе место [1].

Время использования подобных машин строго ограничено и расписано на многие месяцы вперед, так как мощностями таких машин пользуется, как правило, несколько учреждений. Эти машины представляют собой большое количество мощных процессоров, соединенных локально для организации параллельных вычислений.

В настоящее время персональные компьютеры имеются почти у каждого человека, а нынешний уровень технологий в области распараллеливания задач таков, что позволяет использовать CPU, процессоры видеокарт, игровых приставок, и другие устройства для выполнения вычислений аналогично суперкомпьютерам.

В данном случае это не фиксированная система серверных компьютеров или объединенных в сеть процессоров, а легко масштабируемая система из большого количества компьютеров по всему миру.

Такая система называется грид (англ. Grid – решётка, сеть). Ключевой её особенностью является возможность объединения разнородных систем, например настольных компьютеров, работающих под разными операционными системами, игровых приставок, специализированных устройств для решения как масштабных задач (разрешение математических проблем, прогнозирование появления новых частиц), так и для задач отдельных фирм или предприятий (экономическое моделирование).

Неоднородность такой среды налагает соответствующие требования:

  1. Виртуализация ресурсов – необходима для снижения сложности управления и приведения используемых ресурсов к единому стандарту.
  2. Общие средства управления – необходимы для соблюдения одинакового порядка управления ресурсами разнородных систем.
  3. Поиск и запрос ресурсов – требуются механизмы, необходимые для поиска ресурсов с заданными атрибутами и для получения свойств этих ресурсов. Поиск и запрос должны осуществляться в динамичной и разнородной системе [2].

Получившийся “виртуальный компьютер” по производительности равносилен суперкомпьютерам. Такая система формирует очередь заданий, которые выдаются по сети другим элементам грида. Задача может быть прервана, или не выполнена до конца. На этот случай для обеспечения стабильности планировщик заданий выдает дополнительные “копии” этих задач другим элементам грида. Затем результаты обобщаются, и обрабатываются [3].

Для создания грид-систем используется специализированный программный инструментарий. Из всех средств развертывания грид-сетей стандартом считается Globus Toolkit. Globus Toolkit представляет собой набор инструментов и стандартов, главным из которых является стандарт OGSA (Open Grid Services Architecture). OGSA определяет единообразную семантику представления служб [4], стандартные механизмы для создания, именования обнаружения экземпляров Grid-служб, обеспечивает прозрачность местонахождения и связывания различных протоколов и поддерживает интеграцию с базовыми механизмами нижележащих платформ. Разработка технической спецификации OGSA ведется в рамках форума Grid Global Forum, разрабатывающего стандарты для Grid-сообщества [5].

Прогресс в развитии науки и техники, рост производительности мобильных устройств позволяет сегодня использовать мобильные и беспроводные устройства для организации гридов. Это одно из современных направлений в грид-технологиях. Бесспорным плюсом является тот факт, что в мобильных гридах возможно использовать беспроводные датчики и другие устройства, что актуально при использовании грида в полевых условиях. Однако существует ряд технических трудностей, связанных с интеграцией беспроводных устройств в  грид.

К этим трудностям относятся: невысокая пропускная способность, проблемы обеспечения информационной безопасности, высокое потребление энергии. На сегодняшний день было предложено много вариантов реализации мобильных гридов. Среди существующих мобильных грид-проектов следует отметить проекты Akogrimo, ISAM и MADAM [6].

Существующие географически-разделенные грид-системы представлены рядом интереснейших проектов, в которых участвуют добровольцы со всего мира. Одной из платформ для таких проектов является BOINC (англ. Berkeley Open Infrastructure for Network Computing – открытая программная платформа (университета) Беркли для GRID вычислений). BOINC – это некоммерческий программный комплекс для организации распределенных вычислений, первоначально разработанный для проекта [email protected] (от англ. Search for Extra-Terrestrial Intelligence at Home – поиск внеземного разума на дому). Впоследствии платформа стала доступной для сторонних проектов.

Серверная часть BOINC состоит из HTTP-сервера с веб-сайтом проекта, базы данных MySQL и набора демонов (генератор заданий, планировщик, валидатор, ассимилятор результатов).

HTTP сервер представляет собой набор PHP-скриптов и необходим организаторам проектов для общего управления проектом: регистрация участников, распределение заданий для обработки, получение результатов, управление базами данных проекта. В базе данных хранятся пользователи, пароли, записи заданий, результатов, информация о хостах, программах проекта и прочее.

Для пользователей понятие BOINC чаще используется в контексте понятия BOINC-клиент — универсальный клиент для работы с различными (BOINC-совместимыми) проектами распределённых вычислений.  BOINC-клиент  позволяет  участвовать  одновременно  в  нескольких  проектах  с помощью одной общей программы управления (boinc или boinc.exe). Для визуализации процесса управления BOINC- клиентом можно использовать либо поставляемую по умолчанию официальную программу-менеджер (boincmgr или boincmgr.exe), либо воспользоваться «неофициальной» программой для мониторинга и управления BOINC-клиентом.

Следует отметить, что собственно BOINC-клиент в академическом понимании не имеет пользовательского интерфейса как такового, а представляет собой сервис, запускаемый при запуске системы, и управляется по протоколу TCP/IP. Однако для конечного пользователя это не имеет значения, поскольку дистрибутив программы комплектуется программой-менеджером, которая сразу по умолчанию устанавливается вместе с BOINC-клиентом как единое целое и абсолютно прозрачна для пользователя. В этом случае в качестве адреса управляемого программой менеджером BOINC-клиента указывается  адрес «localhost».

Таким образом, с одной стороны, ничто не мешает пользователю использовать альтернативную программу-менеджер для управления BOINC-клиентом, а с другой стороны, даёт возможность управлять несколькими BOINC-клиентами, находящимися на разных компьютерах из одной программы-менеджера. Такая организация управления BOINC-клиентом подразумевает возможность использовать BOINC-клиент в «невидимом» режиме, когда запускается исключительно сервис, без пользовательского интерфейса вообще.

В более ранних версиях клиента отсутствуют локальные настройки программы. Почти всю конфигурацию (например, время работы, время соединения, максимальную загрузку и т.д.) участник указывает на сайте конкретного проекта (для каждого проекта по отдельности), а оболочка (клиент) самостоятельно подгружает конфигурацию вместе с заданиями по мере необходимости. Однако в последних версиях это можно настроить через интерфейс самого клиента.

Периодически составляется топ популярнейших проектов BOINC. Ниже представлены топ-10 проектов BOINC на данный момент [7]:

[email protected] – анализ сигналов с радиотелескопа Аресибо, а также ряда других радиотелескопов, с целью поиска внеземного разума.

[email protected] – проверка гипотезы Эйнштейна о гравитационных волнах, а также поиск радио- и гамма-пульсаров.

World Community Grid – поддерживает большое количество других проектов, созданных для исследований в области поиска лекарств от рака, СПИД, малярии, для разработки экологически чистых источников энергии.

[email protected] – помощь в исследованиях и разработках лекарств.

[email protected] – создание высокоточной трёхмерной модели звёздных потоков нашей галактики.

PrimeGrid – поиск больших простых чисел. Climate Prediction – изучение изменений климата. SIMAP – создание базы данных белков.

[email protected] – поиск модели, которая наилучшим образом описывала бы нашу вселенную в рамках доступных астрономических и физических данных.

[email protected] – изучение белковых структур.

В проектах, базирующихся на BOINC, задействовано более миллиона машин. Общая производительность составляет порядка 8-10 петафлопс. В проектах BOINC участвуют команды волонтёров со всего света, в том числе и из России, однако в Казахстане и России развитие собственных грид-систем находится на невысоком уровне.  Россия  активно  использует  суперкомпьютеры,  Казахстан  начинает их использование (Казахский национальный технический университет и Казахстанско-Британский технический университет пользуются суперкомпьютерами невысокой производительности [8]), однако грид-системы пока не получили большого распространения.

На данный момент, в разработке находятся стандарты для Российских грид-систем, разрабатываемые с учётом интеграции в международную среду. Возможно, в ближайшем будущем в ходе освоения грид- систем в России и Казахстане станет возможным использование дешёвых высокопроизводительных систем в вузах и научных центрах для организации собственных масштабных проектов.

Обобщая вышесказанное, можно сделать вывод о том, что грид-системы являются отличным инструментом для решения задач, требующих высоких вычислительных  мощностей,  не  требуя  при этом больших затрат. Грид-системы являются легко масштабируемыми, гибкими и имеют возможность быстрой интеграции беспроводных устройств, что говорит о значительном потенциале их использования, а с возможностью привлечения волонтёров это открывает большой простор для научного использования грид-систем.

 

СПИСОК ЛИТЕРАТУРЫ 

  1. China’s Tianhe-2 Supercomputer Maintains Top Spot on 42nd TOP500 List. – Режим доступа: http:// top500.org/blog/lists/2013/11/press-release/.
  2. Журавлев Е.Е., Корниенко В.Н., Олейников А.Я. и др. Модель открытой Грид-системы // Журнал радиоэлектроники. – 2012. – N – С. 5-6.
  3. Ferreira L., Berstis , Armstrong J. Introduction to Grid Computing with Globus. – Copyright International Business Machines Corporation, 2002, 2003. – Р. 16-22.
  4. Frederic Magoules, Jie Pan, Kiat-An Tan, Abhinit Introduction to Grid Computing. – CRC Press, 2009. – С. 4-8.
  5. Телематика 2004: XI Всероссийская научно-методическая конференция. – Режим доступа: http:// tm.ifmo.ru/tm2004/db/doc/get_thes.php?id=410.
  6. Захаров А.В., Митихин В Г., Серов В.В. Поиск методов построения эффективных мобильных грид-систем // Материалы конференции «Развитие суперкомпьютерных и грид-технологий в России» в рамках МСКФ-2011. – Режим доступа: http://www.hpc-platform.ru/tiki-index.php?page=MSCF.
  7. com – project popularity. – Режим доступа: http://boincstats.com/en/page/projectPopularity.
  8. Развитие суперкомпьютерных технологий в Казахстане. – Режим доступа: http://profit.kz/articles/1256/Razvitie-superkomputernih-tehnologij-v-Kazahstane/.

Фамилия автора: К.В. Семёнов, А.Н. Антропов

articlekz.com

Радченко Глеб Игоревич



Научные интересы

  • Грид-вычисления.
  • Облачные вычисления.
  • Распределенные вычислительные системы.

Публикации

Проекты

  1. Проект Erasmus+ [email protected] Основная цель проекта [email protected] – поддержка развития, модернизации, интернационализации высшего образования, а именно исследовательской составляющей европейского образования уровня PhD, содействие созданию новых PhD-программ в странах-партнерах в области программной инженерии.
  2. Сервисно-ориентированный подход к использованию проблемно-ориентированных пакетов в распределенных и грид-средах (проект DiVTB).
  3. Параллельная реализация нейросетевого алгоритма распознавания раздельной речи (Часть 1, Часть 2, Часть 3).

Новости

  • [2013-12-25]  Обновления страниц курсов:
  • [2013-12-17]  Обновления страниц курсов:
  • [2013-11-28]  Обновления страниц курсов:

 

  • [2013-11-07]  Размещены слайды презентаций:
  • [2013-10-26] Размещены слайды презентаций:
  • [2013-06-03]  Размещены слайды презентаций:

[Архив новостей]

Ссылки

  • Mendeley — система для каталогизации и управления библиографией. Встраивается в Microsoft Word, позволяя автоматизировать процесс управления списками литературы при подготовке статей. Поддерживает множество форматов оформления библиографических ссылок, включая ГОСТ-7.0.5-2008.
  • Memsource — операционная среда для выполнения письменных переводов, включающая базы памяти переводов, встроенный машинный перевод, модуль управления терминологией, а также текстовый редактор MemSource Editor. Может импортировать и экспортировать документы всех стандартных форматов, включая Word и PowerPoint.

Мой профиль

 

glebradchenko.susu.ru

grid-система Википедия

Многозадачный сервер для вычислений.

Грид-вычисления (англ. grid — решётка, сеть) — это форма распределённых вычислений, в которой «виртуальный суперкомпьютер» представлен в виде кластеров, соединённых с помощью сети, слабосвязанных гетерогенных компьютеров, работающих вместе для выполнения огромного количества заданий (операций, работ). Эта технология применяется для решения научных, математических задач, требующих значительных вычислительных ресурсов. Грид-вычисления используются также в коммерческой инфраструктуре для решения таких трудоёмких задач, как экономическое прогнозирование, сейсмоанализ, разработка и изучение свойств новых лекарств.

Грид с точки зрения сетевой организации представляет собой согласованную, открытую и стандартизованную среду, которая обеспечивает гибкое, безопасное, скоординированное разделение вычислительных ресурсов и ресурсов хранения[1] информации, которые являются частью этой среды, в рамках одной виртуальной организации.[2]

Грид-вычисления можно организовать на базе множества устаревших моделей персональных компьютеров объединённых в иерархическую локальную вычислительную сеть (например, Ethernet и др.) с присутствием серверов. Эта сеть может иметь соединение с интернетом.[источник не указан 1748 дней]

Концепция грид[ | ]

Грид является географически распределённой инфраструктурой, объединяющей множество ресурсов разных типов (процессоры, долговременная и оперативная память, хранилища и базы данных, сети), доступ к которым пользователь может получить из любой точки, независимо от места их расположения.[3]

Идея грид-компьютинга возникла вместе с распространением персональных компьютеров, развитием интернета и технологий пакетной передачи данных на основе оптического волокна (SONET, SDH и ATM), а также технологий локальных сетей (Gigabit Ethernet). Полоса пропускания коммуникационных средств стала достаточной, чтобы при необходимости привлечь ресурсы другого компьютера. Учитывая, что множество подключенных к глобальной сети компьютеров большую часть рабочего времени простаивает и располагает большими ресурсами, чем необходимо для решения их повседневных задач, возникает возможность применить их неиспользуемые ресурсы в другом месте.

Сравнение грид-систем и обычных суперкомпьютеров[ | ]

Распределённые, или грид-вычисления, в целом являются разновидностью параллельных вычислений, которое основывается на обычных компьютерах (со стандартными процессорами, устройствами хранения данных, блоками питания и т. д.), подключенных к сети (локальной или глобальной) при помощи обычных протоколов, например Ethernet. В то время как обычный суперкомпьютер содержит множество процессоров, подключенных к локальной высокоскоростной шине.

Основным преимуществом распределённых вычислений является то, что отдельная ячейка вычислительной системы может быть приобретена как обычный неспециализированный компьютер. Таким образом можно получить практически те же вычислительны

ru-wiki.ru

GRID — ТЕХНОЛОГИИ | KazOrta.org




GRID — ТЕХНОЛОГИИ.

 ИСПОЛЬЗОВНИЕ GRID-ТЕХНОЛОГИЙ ДЛЯ РЕШЕНИЯ ПРИКЛАДНЫХ ЗАДАЧ

 Оспанов А.А.



.

Евразийский национальный университет им. Л.Н.Гумилева, Астана

Научный руководитель – д.ф.м.н., профессор Тусупов Джамалбек Алиаскарович

Грид – географически распределенная инфраструктура, объединяющая множество ресурсов разных типов (процессоры, долговременная и оперативная память, хранилища и базы данных, сети), доступ к которым пользователь может получить из любой точки, независимо от места их расположения. [1]

Grid-технологии позволяют создать географически распределенные вычислительные инфраструктуры, которые объединяют разнородные ресурсы и реализуют возможность коллективного доступа к этим ресурсам. Принципиальной новизной этих технологий является объединение ресурсов путем создания компьютерной инфраструктуры нового типа, обеспечивающей глобальную интеграцию информационных и вычислительных ресурсов на основе сетевых технологий и специального программного обеспечения промежуточного уровня (middleware). А также набора стандартизованных сервисов (служб) для обеспечения надежного совместного доступа к географически распределенным информационным и вычислительным ресурсам: отдельным компьютерам, кластерам, хранилищам информации и сетям [2].





Grid-технологии обеспечивают гибкий, безопасный и скоординированный общий доступ к ресурсам, под которыми понимаются не только процессорные ресурсы или ресурсы хранения информации, но и сетевые ресурсы, а также системное или прикладное программное обеспечение

В настоящее время, грид используется в различных сферах жизнедеятельности. В частности, широко применяется в научной сфере для решения сложных научных, производственных и инженерных задач, которые невозможно решить в разумные сроки на отдельных вычислительных установках. Так примером использования грид-технологий является адаптация  прикладного пакета FDS в грид-среду.

Программа FDS (Fire Dynamics Simulator) реализует вычислительную гидродинамическую модель (CFD) тепломассопереноса при горении. FDS численно решает уравнения Навье-Стокса для низкоскоростных температурно-зависимых потоков, особое внимание уделяется распространению дыма и теплопередаче при пожаре. [3]

FDS — бесплатное программное обеспечение, разработанное Национальным институтом стандартов и технологии (НИСТ) министерством торговли США при содействии Технического научно-исследовательского центра VTT.

Основной целью FDS  на протяжении своего развития было решение прикладных задач пожаробезопасности и в тоже время обеспечение инструмента для изучения фундаментальных процессов при пожаре.

Гидродинамическая модель   (CFD)  численно решает уравнения Навье-Стокса для низкоскоростных температурно-зависимых потоков,  особое внимание уделяется распространению дыма и теплопередаче при пожаре.  Основным алгоритмом является определенная схема метода предиктора-корректора второго порядка точности по координатам и времени. Турбулентность выполняется с помощью модели Смагоринского  «Масштабное моделирование вихрей» (LES).  Прямое численное моделирование (DNS)  можно выполнять,  если лежащая в основе расчетная сетка достаточно точна.




.

При использовании  данной программы при вычислениях требуется довольно большие ресурсы, так как много входных и выходных данных. Поэтому адаптация данного пакета в грид-среду помогает решить данную проблему.  Для адаптация данного пакета можно использовать European Middleware Initiative (EMI) — это программная платформа для высокопроизводительных распределенных вычислений. Целью проекта EMI является поставка консолидированного промежуточного набора компонент на основе четырех основных поставщиков промежуточного программного обеспечения в Европе — ARC, dCache, gLite and UNICORE. EMI является первым шагом на пути стабильной интеграции распределённых вычислений и услуг по управлению данными. [4]

В ходе выполнения данного этапа ожидается следующий результат: возможность пользователя формировать и запускать счётные задания в грид-сету, контролировать ход их выполнения и получать результаты вычислений с помощью проблемно-ориентированного веб-интерфейса,  скрывающем от пользователя детали и сложности работы самой грид-сети, а непосредственный счёт на вычислительных ресурсах будет выполняться с использованием прикладного пакета, который должен быть установлен на рабочих узлах грид-сайта.

Литература

  1. Белов С.Д., Сети нового поколения и грид-технологии, Учебный курс
  2. Электронный ресурс http://grid.jinr.ru/
  3. Электронный ресурс http://code.google.com/p/fds-smv/
  4. Электронный ресурс European Middleware Initiative —  http://www.eu-emi.eu/





Вконтакте

Facebook

Twitter

Мой мир

kazorta.org

Грид технологии Содержание Введение

Грид технологии

Содержание

  • Введение

  • История возникновения вычислительных сетей

  • История и виды распределенных вычислений

  • Грид

Введение

Объем курса

Лекционные занятия:

  • 7 (базовые лекции) + 4 (доклады) = 11;

Базовые технологии и знания

Технологии, которые затрагивает данный курс

Основные вопросы, освещаемые данным курсом

  • История и развитие распределенных вычислений.

  • Технологии распределенных вычислений: интернет-вычисления, P2P, грид, SOA.

  • Грид: определение, применение, стандартизация.

  • Слои архитектуры грид, основные сервисы грид.

  • Основные технологии и стандарты распределенных вычислений и грид: WSRF, OGSA;

  • Технологии разработки и использования ресурсов Грид и P2P-систем (UNICORE, Globus, Legion, Gridbus, Alchemi, BONIC, GPE4GTK)

Основные вопросы, освещаемые данным курсом

  • Архитектура Грид

    • Уровни архитектуры грид
    • Связь WEB-сервисов и Грид
    • Базовые виды сервисов, предоставляемые Грид-системами
    • Модели аутентификации и методы обеспечения безопасности
    • Потоки заданий в Грид. Применение workflow-методологии в Грид-приложениях

Основные вопросы, освещаемые данным курсом

  • Стандарты разработки и функционирования Грид-систем

    • WEB-сервисы (WSDL), WS-ресурсы, WSRF
    • OGSI, OGSA
    • Стандарты безопасности (public key cryptography)

Основные вопросы, освещаемые данным курсом

  • Технологии разработки и использования ресурсов Грид и P2P-систем

    • Globus (GTK 4.0)
    • Архитектура пакета Globus Tool Kit
    • Основные сервисы
    • Методы разработки Грид-приложений
    • GPE4GTK
    • Архитектура среды Grid Programming Environment
    • Специфика и методы разработки распределенных приложений в среде GPE
    • P2P среда Alchemi
    • Описание основных отличий P2P от Грид-систем
    • Изучение методов разработки базовых P2P-приложений

История становления вычислительных сетей

Начало… ARPANET (1969)

  • Предшественник Internet.

  • Основывалась как «Сеть исследователей».

  • Начиналась со скорости 56 kbps.

  • Основывалась на технологии TCP/IP.

Основные задачи

  • E-mail

  • Удаленный доступ к ресурсам

  • Удаленное управление заданиями

Удаленный доступ к ресурсам

Обеспечение распределенного доступа к ограниченным ресурсам mainframe-компьютеров для географически-распределенных пользователей.

Это позволяло отказаться от дорогих переездов к компьютерным центрам для постановки задач и обеспечивало удаленное использование ресурсов.

Начало… Основа ARPANET — TCP/IP

TCP/IP развивался более активно, чем другие технологии связи (FidoNet, UUCP, OSI, X.25…)

Причины определения TCP/IP как стандарта:

  • Открытая документация протокола;

  • Открытый исходный код;

  • Использование архитектура ARPANET/Internet и протокола TCP/IP для обучения => большой объем исследований в университетских лабораториях.

Развитие и включение ПК в сеть (1)

Изначально, LAN не был предусмотрен в структуре ARPANET. Доступ в сеть предоставлялся с терминала mainframe-компьютера либо с «миникомпьютера» DEC PDP-11.

Но разработка прототипа Ethernet (3 mbps) и рабочей станции в Xerox Palo Alto Research Center (PARC) явилось первым шагом к формированию LAN.

Развитие и включение ПК в сеть (2)

Рост мощности ПК привел к тому, что они смогли обеспечить доступ в сеть.

Таким образом, модель сети сменилась:

Мейнфреймы никуда не исчезли, но преобразовались в серверы.

Цикличность развития вычислительных сетей

История и виды распределенных вычислений

Развитие распределенных вычислений и грид

Первый этап.

Середина 1990-х – становление и развитие систем распределенных вычислений.

Второй этап.

1998 г. – определение термина Grid (грид) в рамках книги «Грид. Новая инфраструктура вычислений» . Развитие распределенных систем, ориентированных на массивные объемы передачи информации и вычислительные затраты.

Третий этап.

2001 г. – уклон в сторону “Виртуальных организаций”. Развитие сервисно-оринентированных подходов (SOA), автоматизация методов управления ресурсами.

Общая тенденция развития распределенных вычислений

Первый этап – становление распределенных вычислений

Первые проекты по распределенным вычислениям (начало 1990-х) основывались на объединении вычислительных ресурсов суперкомпьютеров.

Проект FAFNER: Factoring via Network-Enabled Recursion (Сетевое разложение на множители посредством рекурсии).

Проект I-WAY: Information Wide Area Year (Год Информации Глобальных Сетей) – экспериментальная высокопроизводительная сеть, которая объединяла множество высокопроизводительных компьютеров и передовые средства визуализации. Прообраз Globus.

Второй этап – развитие средств создания грид

Ближе к концу 1990-х годов наблюдается бурное развитие Grid-систем, начинаются разработки средств создания и управления Grid-сетями и вычислительными ресурсами.

В ходе исследований систем распределенных вычислений, Ян Фостер вывел 3 основных требования, которым они должны удовлетворять.

  • Гетерогенность.

  • Масштабируемость.

  • Адаптируемость.

Основные проекты: Globus, [email protected] (P2P)…

Третий этап – грид как виртуальная организация

Развитие технологий в начале 21-го века приводит к переосмыслению понятия Grid. Теперь оно неразрывно связано с понятием “Виртуальной организации”.

Развитие сервисно-ориентированных подходов позволяет гибко использовать одни и те же вычислительные ресурсы многими пользователями.

Основные проекты и технологии: Globus, OGSA, WSRF

Виды вычислительных систем

Интернет вычисления

P2P

  • Примеры проектов:

    • eDonkey
    • Kazaa, Napster (RIP)
    • BitTorrent
    • Jabber
    • Skype (!!)

Грид

Что такое грид?

Грид – как электросеть:

1) координирует ресурсы, не подчиняющиеся централизованному контролю…

2) …используя стандартные, открытые протоколы и интерфейсы общего назначения …

3) …чтобы предоставить возможность работы с нетривиальными свойствами служб.

Метафора грид

Grid (англ.) –сеть, энергетическая система.

Концепция Грид

  • Аналогия с энергетической системой (Power Grid)

    • Повсеместный, стандартный, надежный и дешевый доступ к ресурсам
    • Сложность инфраструктуры скрыта от пользователя (прозрачность)
    • Легкость интеграции новых ресурсов
    • Динамическое перераспределение нагрузки и отказоустойчивость
    • Управление сложным ансамблем ресурсов

Концепция Виртуальной Организации (ВО)

ВО это ряд людей и/или организаций, объединенных общими правилами коллективного доступа к определенным вычислительным ресурсам.

Например:

  • провайдеры прикладных услуг, провайдеры услуг хранения;

  • участники промышленного консорциума, финансирующие создание нового самолёта;

  • участники многолетних, крупных международных объединений в области физики высоких энергий.

Пример ВО

Грид VS Все остальное

  • Три критерия грид:

    • Осуществляется координация ресурсов, не управляемых централизованно
    • С использованием стандартных, открытых и универсальных протоколов и интерфейсов
    • Для предоставления нетривиального качества обслуживания
  • Что не является Grid?

    • Кластер, сетевое хранилище данных, научный прибор, сеть, …
    • Важные компоненты Grid, но сами им не являются

Сопоставление кластера, грид и P2P

Зачем изучать грид?

  • Грид-системы находят все большее применение в различных отраслях науки и бизнеса;

  • Наблюдаются серьезные успехи в стандартизации технологий разработки и функционирования Грид-систем;

  • Для развития всех направлений Грид-технологий требуется множество высококвалифицированных специалистов в этой области.

Популярные приложения Грид

  • Высокопроизводительные вычисления

    • Интерактивное моделирование (климат)
    • Имитационные эксперименты с высоким разрешением / большим числом объектов (формирование галактик, гравитационные волны, имитация боевых действий)
    • Проектирование (прогон вариантов, объединение моделей компонентов)
  • Работа с большими массивами данных

    • Анализ экспериментальных данных (физика высоких энергий)
    • Анализ изображений и данных зондирования (астрономия, изучение климата, экология)
  • Совместная работа в рамках распределенных коллективов

    • Удаленное управление приборами (микроскопы, рентгеноскопия , …)
    • Удаленная визуализация (изучение климата, биология)
    • Engineering (large-scale structural testing, chemical engineering)
  • Сложность задач требует совместной работы людей из различных организаций и разделяемого использования ресурсов, данных и приборов.

Пример применения грид : Большой Адронный Коллайдер (1)

Пример применения грид : Большой Адронный Коллайдер (2)

Информация о Грид

Спасибо за внимание!

Ваши вопросы?

rpp.nashaucheba.ru