Загрузка...
Ошибка

Видеочип GF100 (GT300): предварительная информация о характеристиках

Ответить на тему

Sergey1982

0  
О характеристиках этого чипа ходит много противоречивых слухов, но чем ближе анонс новинки, тем больше правдоподобной информации попадает нам в руки. Итак, на сегодняшний день характеристики GF100 (GT300) выглядят следующим образом:
  • 3 миллиарда транзисторов;
  • 512 потоковых процессоров (CUDA Cores в терминологии NVIDIA);
  • 128 блоков выборки текстур (TMU);
  • 48 блоков растровых операций (ROP);
  • 384-битная шина памяти, с поддержкой GDDR-5;
  • Поддержка до 6 Гб видеопамяти;
  • Поддержка ECC;
  • Новая архитектура Fermi, см. ниже;
  • Поддержка DirectX 11;
  • Два диспетчера потоков (Shedulers);
  • Отсутствие аппаратного блока тесселяции, данный функционал будет реализован программно;
  • Энергопотребление около 200 Вт.
Рассмотрим подробности новой архитектуры – Fermi. NVIDIA утверждает, что это крупнейшее и важнейшее обновление архитектуры с момента выпуска G80 (GeForce 8800 GTX). Итак, что же нового?
  • Потоковые процессоры (CUDA Cores). Их число составляет 512 штук, причём в отличие от GT200, теперь за расчёты с одинарной (FP32) и двойной (FP64) точностью отвечают одни и те же блоки. При использовании FP64 темп работы снижается вдвое, обеспечивая таким образом 256 вычислений с двойной точностью за такт. У GT200, для сравнения, было только 30 выделенных блоков для подобных расчётов. Кроме того, каждое CUDA Core содержит в себе помимо устройства для операций с плавающей запятой, отдельное устройство для целочисленных операций с 64-битной точностью. Все расчёты выполняются этими устройствами за один такт. Никуда не делись и блоки для специальных операций (SFU), которые позволяют вычислять синус, косинус, квадратный корень и другие сложные функции. Но если раньше соотношение SP и SFU составляло 4 к 1, то теперь на каждый SFU приходится 8 SP, т.е. в два раза больше. С другой стороны, их производительность выросла примерно в четыре раза, так что общий удельный прирост можно оценить как двукратный;
  • Иерархическая организация чипа тоже изменилась. Если раньше базовой единицей был TPC (текстурно-процессорный кластер), содержащий в себе восемь блоков выборки текстур (TMU) и три массива потоковых процессоров (SM), то теперь TPC фактически упразднён, уступив место SM, который “располнел” с 8 потоковых процессоров до 32. Таким образом, GF100 (GT300) содержит в себе 16 блоков SM, каждый из которых состоит из 2х16 CUDA Cores, 16 блоков загрузки и выгрузки данных (LSU) и 4 SFU;
  • Два диспетчера потоков на каждом SM обеспечивают фактически аналог технологии Hyper-Threading на GPU, что благоприятно сказывается на эффективности загрузки исполнительных устройств и, следовательно, на производительности;
  • GPU содержит настраиваемые кэши первого уровня суммарным объёмом 1 Мб и кэш второго уровня объёмом 768 Кб.
Пока это все подробности. Уже можно заметить, что немало изменений направлено на повышение КПД расчётов общего назначения на GPU, однако, будем надеяться, что обновление архитектуры благоприятным образом сказалось и на 3D приложениях. Кроме того, хочется отметить, что новая архитектура изменена настолько, что в ней не осталось фактически ничего от оригинала – G80, и их схожесть улавливается только на схемах с топологией, но не более. Свежая информация будет публиковаться по мере поступления.
Источник: overclockers.ru
 

good_win

0  
ну поживем увидим кто кого Smile
 

Sergey1982

0  
Архитектура NVIDIA Fermi найдёт применение в суперкомпьютерах
Краткое знакомство с архитектурой Fermi, которую будут использовать и игровые видеочипы GF100, позволяет нам утверждать, что свой новый графический процессор NVIDIA в известной степени ориентирует на рынок ускорения вычислений, ёмкость которого достигает $1,1 млрд. в год. Если говорить о рынке дискретных графических решений, то его ёмкость измеряется полутора-двумя миллиардами долларов США в год. Рынок GPGPU, таким образом, находится в зачаточном состоянии, но NVIDIA видит в нём хорошие перспективы роста.
Кстати, из прогнозов независимых аналитиков становится известно, что 512 потоковых процессоров нового флагмана NVIDIA могут работать на частоте около 1.5 ГГц. Такие характеристики обеспечивают быстродействие на уровне 1,5 трлн. операций с плавающей запятой в секунду. Стоимость системы с уровнем быстродействия в 1 терафлопс ещё несколько лет назад могла достигать $10 000. Это даёт NVIDIA основания утверждать, что архитектура Fermi позволяет создавать суперкомпьютеры, которые в десять раз быстрее существующих ныне. Fermi поддерживает до 6 Гб памяти типа GDDR-5, использующей 384-битную шину. Аналитики предполагают, что частота используемых чипов памяти достигнет 2 ГГц (4 ГГц QDR). Это позволит на треть превзойти GT200 по быстродействию памяти, даже с учётом "сужения" шины памяти с 512 до 384 бит.
Возвращаясь к теме суперкомпьютеров, нельзя обойти стороной пресс-релиз, в котором NVIDIA рассказывает о перспективах использования архитектуры Fermi в суперкомпьютере, который построит национальная лаборатория Oak Ridge. Эта вычислительная система будет в десять раз быстрее существующих суперкомпьютеров, причём графические процессоры NVIDIA в ней будут сочетаться с центральными процессорами. Кто будет производителем последних, не уточняется, но выбор наверняка ограничится Intel и AMD. Суперкомпьютер Oak Ridge будет заниматься вычислениями в энергетической сфере и поможет изучать проблему изменения климата. Предложенная архитектура в ближайшие десять лет позволит достичь быстродействия свыше тысячи петафлопс, что соответствует миллиону триллионов операций с плавающей запятой в секунду.
Источник: overclockers.ru
Фото дня: графический акселератор NVIDIA Tesla на архитектуре Fermi
На конференции GPU Technology Conference в Сан Хосе, Калифорния, была официально анонсирована архитектура графического процессора общего назначения (GP-GPU) под кодовым названием Fermi. Руководитель и соучредитель компании NVIDIA Джен-Сун Хуанг (Jen-Hsun Huang) впервые показал образец графического ускорителя на чипе GT300. Первым решением на графическом процессоре GT300, показанным публике, стала высокопроизводительная видеокарта под названием Tesla. Источнику стали доступны фотографии референсной платы и обратной стороны самого GPU. Выполненная в хромированном исполнении, видеокарта Tesla не слишком длинная, причём явно заметна работа дизайнеров компании по уменьшению её размеров. Питание видеокарты обеспечивается от восьми- и шестиштырькового разъёмов питания PCI-E, которые расположены не рядом друг с другом. Горячий воздух выдувается кулером через отверстия в печатной плате, а пластина на задней стороне карты дополнительно охлаждает GPU и другие компоненты. На первый взгляд, размеры графического процессора не превышают размеры чипа GT200 или его предшественника G80.
Однако, по словам источника, при детальном изучении печатной платы было выяснено, что это скорее не рабочий образец, а макет, изготовленный специально для конференции, чтобы показать, как будет выглядеть видеокарта нового поколения.
Источник: HardwareZone, ixbt.com
GF100 (GT300): новые подробности
На этой неделе основным источником новостей является графический процессор следующего поколения GF100, известный ранее как GT300. Являясь первым воплощением новой вычислительной архитектуры Fermi, этот чип обещает произвести революцию не только в расчётах общего назначения на GPU, но и в 3D. Впрочем, представители NVIDIA пока воздерживаются от каких-либо комментариев по поводу производительности новинки в 3D.
Но, перейдём к изучению новых подробностей о GF100. Итак, начнём со схематичного изображения: Как видно, схема подтверждает ранее известную информацию. Напомним, вкратце, основные характеристики GF100. Новая архитектура Fermi, 512 потоковых процессоров (ядер), разбитые на 16 блоков по 32 штуки, 128 блоков выборки текстур (TMU), 48 блоков растровых операций (ROP) и 384-битная шина памяти с поддержкой до 6 Гб видеопамяти GDDR-5. Тактовые частоты новинки, составят, предположительно, 650/1700/4200 МГц для ядра, шейдерного домена и памяти соответственно. А вот как выглядит снимок ядра: Хорошо заметны 16 однотипных блоков (SM), занимающих две трети ядра. Интерфейсы ввода-вывода расположились, закономерно, по периметру кристалла. А вот так выглядит уже упакованный GF100: Подобно своим предшественникам – G80 и GT200, кристалл защищён медной пластиной, которая не только защищает кристалл от скола, но и является теплораспределителем. Нанесённая на крышке маркировка позволяет понять, что под ней прячется кристалл первой ревизии (А1), произведённый на 35 неделе этого года, т.е. между 24 и 30 августа. Оборотная сторона чипа интересна числом электрических выводов, которых там около 1900 штук. Это почти на 450 штук больше, чем у G80, что объясняется дополнительными выводами для поддержки GDDR-5, но на 600 штук меньше, чем у GT200, что объясняется наличием 384-битной шины памяти вместо 512-битной. Рассмотрим упущенные ранее подробности об архитектуре. Во-первых, регистровые файлы потоковых процессоров были удвоены по сравнению с GT200. Это благоприятно скажется на исполнении сложных шейдеров, ну и, разумеется, GPGPU вычислениях. Второй важный момент, это возможность управлять размером кэша L1 и общей памяти в каждом блоке SM. Можно выбирать между двумя значениями – 16 Кб и 48 Кб. Увеличение объёма кэша L1 с 16 Кб до 48 Кб отзовётся симметричным уменьшением общей памяти с 48 Кб до 16 Кб и наоборот. Такая гибкость позволит адаптировать архитектуру к выполнению 3D или GPGPU задач. Последнее, что хочется отметить, это тот факт, что все потоковые процессоры являются FMA устройствами, а не MAD, как раньше. Оба этих блока способны выполнять операцию вида A*B+C, но разница между ними в том, что FMA не округляет результат произведения перед суммированием, что даёт более точный результат, а точность, как известно, никогда не бывает лишней, особенно в научных расчётах. Фактически можно говорить о том, что GPU уже и в этом отношении превзошли CPU, так как современные процессоры не имеют FMA устройства и пока только идёт речь о появлении их в новых поколениях.
Напоследок приведём диаграмму, показывающую пиковую теоретическую производительность на различных операциях у актуальных графических процессоров и Core i7: Источник: overclockers.ru
 

Sergey1982

0  
NVIDIA выпустит GPU с архитектурой Fermi не раньше чем через четыре-пять месяцев
Ссылаясь на слова руководителя NVIDIA, источник поставил точку в спорах о сроках появления на рынке GPU с архитектурой Fermi. Если раньше еще теплилась надежда на то, что поклонники NVIDIA смогут порадовать себя на Новый год соответствующей 3D-картой, то теперь она окончательно развеялась. Серийный выпуск GPU нового поколения компания надеется развернуть только в будущем году
Выступая на пресс-конференции, посвященной итогам квартала, исполнительный директор компании сказал, что первый квартал будущего года будет интересен тем, что объем заказов чипов будет самым большим среди всех первых кварталов. Причиной тому станет выпуск 40-нанометровых GPU с архитектурой Fermi для трех линий продукции: GeForce, Quadro и Tesla.
Как известно, границы первого квартала будущего финансового года у NVIDIA соответствуют календарным датам 26 января и 26 апреля 2010 года. Это означает, что, по самой оптимистичной оценке, решения на базе Fermi появятся на рынке через четыре-пять месяцев. Таким образом, серия ATI Radeon HD 5800, дебютировавшая во второй половине сентября, получила полугодовую фору.
Фактор неопределенности в ситуацию вносят технологические сложности, испытываемые сейчас компанией TSMC, которая изготавливает продукцию по заказам компании NVIDIA, не имеющей собственного производства.
Источник: VR-Zone, ixbt.com
 

Sergey1982

0  
Фотографии прототипа Fermi (GF100)
NVIDIA планирует продемонстрировать рабочие прототипы Fermi уже в ближайшее время, однако первые фотографии и слайды с презентации уже утекли в Сеть, благодаря немецкому ресурсу ComputerBase. Итак, встречайте – Fermi: Данный прототип относится к семейству специализированных плат Tesla, которые предназначены для расчётов общего назначения и обладают увеличенными объёмами видеопамяти. Тем не менее, можно разглядеть ряд интересных нюансов: в текстолите сделаны прорези для забора воздуха турбиной, разъёмы дополнительного питания расположены перпендикулярно относительно друг друга, а металлическая пластина с оборотной стороны платы перекрывает разъём MIO интерфейса. Впрочем, нельзя утверждать, что это финальная версия платы, так как на снимках фигурируют альтернативные версии: На слайдах тоже есть интересная информация. Так, уровень энергопотребления не превысит 225 Вт, что скорее всего будет справедливо и для игровых решений на базе данного чипа: Что касается темпов экспансии на рынок, то на слайдах указано начало второго квартала следующего года: Учитывая специфику этих решений и необходимость мощной программной базы со стороны NVIDIA к моменту анонса, можно предположить, что игровые версии Fermi стартуют как минимум не позже, а скорее всего даже раньше, чем Tesla, как это уже было во время анонса решений на базе G80 и GT200. Ознакомиться со всеми слайдами и фотографиями можно здесь.
Источники: computerbase.de, overclockers.ru
 
▲ Наверх