Вы находитесь на странице: 1из 10

GeForce3: Lightspeed

Memory Architecture
GeForce3: Lightspeed Memory Architecture
GeForce3: Архитектура Памяти Lightspeed
Создание реалистичной 3D - среды в реальном времени на обычном ПК - это цель тысяч разработчиков аппаратного и
программного обеспечения, работающих в индустрии компьютерной графики. В то время как разработки последних лет
достигли невероятных успехов в улучшении качества 3D-графики в реальном времени, одна из фундаментальных проблем в
предоставлении интерактивного 3D-контента остается: повышение производительности при ограниченном увеличении объема
памяти. Память и пропускная способность графической шины остаются важнейшими факторами, определяющими
производительность и качество графики. GeForce3 включает в себя ряд революционных достижений в графической
архитектуре, которые значительно повышают эффективность работы графического процессора с памятью и пропускной
способностью шины, обеспечивая новый уровень производительности и качества изображения.

Bandwidth Challenges
3D-графика в реальном времени накладывает огромную нагрузку на всю архитектуру ПК. Характер графической проблемы
накладывает нагрузку на все аспекты подсистем ПК: микропроцессор, основную память, графическую шину (обычно AGP),
графический процессор (GPU) и память буфера кадров графического процессора. Различные компоненты графического
приложения усиливают нагрузку на различные компоненты, что часто приводит к тому, что производительность конкретного
приложения ограничивается одним системным компонентом в данный момент времени и другим компонентом на долю секунды
позже. Тремя ключевыми факторами стресса в системе являются вычислительная нагрузка, геометрические вычисления и
рендеринг пикселей.

The 3D Graphics Problem


Понимание того, как работают графические приложения, является ключом к пониманию различных проблем, связанных с
повышением производительности графики и эффективности пропускной способности. Типичное графическое приложение,
например интерактивная видеоигра, состоит из четырех основных компонентов: игровой логики, управления сценой,
геометрических вычислений и пиксельного рендеринга. Каждый из них обсуждается ниже.

ИГРОВАЯ ЛОГИКА
Серьёзные, интерактивные 3D-приложения требуют нескольких элементов, чтобы держать пользователей заинтересованными и
развлекать их. Игровая логика, физика, искусственный интеллект (ИИ), сетевое взаимодействие, интерактивность, звук и другие
не графические функции - вот некоторые примеры, и все они являются элементами основного кода игрового движка. Ключ к
отличному контенту - это предоставление увлекательного интерактивного опыта. Чтобы создать этот опыт, разработчики будут
распределять большую часть вычислительной мощности центрального процессора (CPU) на задачи, которые непосредственно
создают эти элементы пользовательского опыта. В той мере, в какой другие аспекты графического приложения могут быть
выгружены из ЦП, этим элементам может быть выделено больше мощности ЦП. С сегодняшними современными графическими
процессорами (такими как GeForce2 GTS и GeForce3) большая часть графической “проблемы” выгружается из ЦП, оставляя
больше ЦП для создания убедительных интерактивных еффектов.

Управление сценами для интерактивного отображения графики.


Необходимо создать базу данных, описывающую "трехмерный мир" и каждый отдельный объект в этом мире. Как правило,
эти базы данных очень велики, иногда содержат сотни мегабайт или даже гигабайты данных. Рендеринг и отображение всех
этих данных просто непрактичны, даже на высококлассных многопроцессорных графических суперкомпьютерах, поэтому эта
задача должна быть упрощена. Графическое приложение должно вычислить, какая часть “мира " или базы данных будет
обработана или визуализирована в данный момент времени.

NVIDIA Corporation |1
Этот процесс вычисления того, какая часть базы данных будет отрисована за один раз, обычно называется управлением сценами.
Обычно используются различные методы, каждый из которых требует компромисса между вычислительными затратами,
требованиями к памяти и точностью. Алгоритмы, которые минимизируют объем данных сцены, необходимых для визуализации
кадра, существуют, но обычно слишком дороги с точки зрения вычислений для практического использования. Следовательно,
большинство графических процессоров на самом деле в конечном итоге обрабатывают во много раз больше данных, чем на
самом деле отображается на экране компьютера. Повышение эффективности обработки управления сценой может повысить
производительность некоторых графических процессоров, но часто происходит за счет увеличения загрузки процессора для этих
функций, что может отвлекать от вычислительной мощности, доступной для игровой логики.

Геометрические вычисления.
Как только приложение вычисляет, какую часть сцены нужно обработать (или визуализировать), оно передает это
подмножество своей базы данных в конвейер геометрии графического приложения. Раньше геометрическая обработка
графических приложений также происходила на процессоре. Эти вычисления обычно включали преобразование геометрии и
ее освещение. Эти вычисления недавно были переданы современным графическим процессорам, начиная с новаторской модели
GeForce 256 TM от NVIDIA и продолжая последующими процессорами NVIDIA. Разгружая геометрическую нагрузку с
главного процессора, можно сделать большую часть процессора доступной для игровой логики. Одновременно современные
графические процессоры, такие как семейство графических процессоров Nvidia GeForce, могут обрабатывать во много раз
больше геометрических данных даже самых быстрых процессоров. При обработке большего количества геометрических
данных визуальное качество может быть значительно улучшено.

Проблема Пропускной Способности Геометрии

Чтобы описать сцены с богатой детализацией, чтобы создать привлекательную картинку, разработчики контента увеличивали
геометрические детали в своих сценах с невероятной скоростью. С появлением графического процессора GeForce 256 большая
часть вычислительной нагрузки для этой функции была перенесена с центрального процессора на графический процессор. Это
смещение вычислительной нагрузки на графический процессор было ключевым фактором, позволившим разработчикам контента
свободно перемещаться от сотен полигонов на кадр к сотням тысяч. Эти детализированные сцены, хотя и на порядок более
привлекательные визуально,также невероятно интенсивны по пропускной способности. С типичной сценой из 100 000 полигонов,
каждый из которых состоит из трех вершин, 300 000 вершин в кадре являются общими. Каждая вершина обычно может содержать
50 байт или более информации для таких вещей, как цвет, положение, освещение, текстурирование и затенение информации.
Таким образом, каждый кадр обычно содержит 15 Мбайт геометрической информации. В то время как отдельный кадр,
безусловно, не будет напрягать даже шину базовой системы ПК, требование запускать этот тип нагрузки со скоростью 60 кадров в
секунду делает эту задачу сложной, поскольку пропускная способность 900 Мбайт/сек, необходимая для такой задачи, будет
толкать каждый компонент ПК к его пределам.

Одна из проблем, с которой сталкиваются современные архитектуры ПК с такими типами нагрузок, - это связь между главным
процессором и сегодняшними графическими процессорами. Связующим звеном между этими двумя системами обычно является
AGP Intel, или ускоренный графический порт. Вторым по распространенности является PCI (peripheral component interconnect).
Самой продвинутой реализацией AGP на сегодняшний день является AGP 4X. спецификация AGP требует соединения точка-точка
между хостом и графическим процессором; следовательно, этот интерфейс не используется совместно с другими устройствами. В
то время как частный интерфейс, безусловно, помогает решить проблему пропускной способности между двумя системами, даже
1,0 ГБ/сек пропускной способности, предлагаемой AGP 4X, недостаточно для детализированных геометрией сцен.

NVIDIA разработала несколько уникальных решений для решения этой геометрической проблемы
пропускной способности. Первый-Это поверхности высокого порядка.

NVIDIA Corporation |2
Поверхности Более Высокого Порядка

Традиционно основным строительным блоком 3D-графики в реальном времени были треугольники. Художники
использовали коллекции треугольников, каждый из которых был построен из трех вершин (углов треугольников),
чтобы построить 3D-объекты. Сложность такого подхода заключается в том, что для создания объектов с богатой
детализацией или плавными кривыми художник вынужден использовать все большее число треугольников, чтобы
получить тонкие уровни детализации или получить изогнутые края, чтобы казаться гладкими.
Поверхности более высокого порядка позволяют разработчикам создавать объекты с использованием кривых,
определенных контрольными точками. Один
кривая или поверхность, определенная набором контрольных точек, называется сплайном. Хотя существует
множество различных типов сплайнов, важно то, что с помощью сплайна и нескольких контрольных точек можно
создавать довольно сложные, гладкие криволинейные поверхности. Соединение сплайнов вместе позволяет
проектировщику создавать сложные криволинейные поверхности, которые трудно создать просто с помощью
треугольников.

Complex object created using higher order surfaces.

GeForce3 поддерживает эти криволинейные поверхности в аппаратном обеспечении, позволяя гораздо более эффективно
описывать сложную геометрию без каждого увеличивающегося числа треугольников. Описывая
поверхности с управляющими вершинами, фактически поверхность описывается формулой, а не тысячами или миллионами
дискретных значений.

Графический процессор GeForce3


способен обрабатывать эти
поверхности высокого порядка в
аппаратном обеспечении и в реальном
времени, по существу принимая эти
небольшие, высокоэффективные
формулы, описывающие геометрию из
шины AGP, а затем обрабатывая эти
формулы, чтобы “создать” геометрию на
графическом процессоре.

NVIDIA Corporation |3
Преимущества поверхностей высокого порядка очевидны: гораздо более высокая производительность и качество изображения,
особенно для сцен, требующих плавных кривых (например, колонны для поддержки крыши храма), и гораздо более
эффективное использование графической шины. Передавая только 16 контрольных точек, графический процессор GeForce3
способен генерировать эквивалент сотен тысяч полигонов геометрических
данных, эффективно предлагая сотни или даже тысячи раз эффективность передачи этих треугольных геометрических данных
по шине. Результат. Более высокая производительность большую часть времени.

Проблема Пропускной Способности Пикселей

Чтобы полностью понять проблемы рендеринга реалистичного 3D-мира, требуется понимание некоторых основных понятий и
терминологии 3D-графики. Ссылки на полезные термины можно найти в приложении в конце настоящего документа.

Вычисление Пропускной Способности Пиксельной Памяти

Традиционные графические архитектуры визуализируют пиксели, считывая и записывая их в цветные и z-буферы, а также
получая доступ к текстурным данным. Они делают это для каждого пикселя, который они визуализируют, независимо от
видимости пикселя. Большинство графических приложений сегодня фактически визуализируют каждый пиксель два-три раза за
кадр, поскольку объекты часто "закрывают" или скрывают другие объекты. Простым примером может служить игра с фоном и
персонажем на переднем плане. Взятая в своей самой простой форме, такая сцена будет иметь сложность глубины в два раза,
причем пиксели фона будут скрыты персонажем на переднем плане.
Рендеринг одного пикселя один раз требует от графического процессора считывания цветового буфера, обнаружения
предыдущего значения, считывания z-значения для определения глубины сцены для пикселя и считывания текстурных
данных, необходимых для отображения текстуры этого пикселя. Как только пиксель генерируется, он требует записи
нового (потенциально смешанного) значения цвета в цветовой буфер и потенциально записи нового значения z-буфера. В
случае рендеринга с 32-разрядной глубиной для каждой из этих операций требуется 32 бита или 4 байта данных на доступ.
Так:

Color Read + z-read + Texture Read + Color Write + z-write


4 байта + 4 байта + 4 байта + 4 байта + 4 байта = 20
байт это вычисление предполагает, что графический процессор извлекает один 32-битный тексель на
пиксель, что делает предположение, что остальные тексели (необходимые для выполнения билинейной фильтрации) уже
находятся на чипе в кэше текстур. 20 байт могут показаться не очень большим количеством данных, но когда полный
кадр визуализируется 2,5 раза на пиксель (средняя сложность
глубины), начинает появляться более интенсивное изображение с интенсивной полосой пропускания.
Предположим, что разрешение составляет 1024 пикселя на 768 пикселей.

Горизонтальное разрешение умножить на вертикальное разрешение умножить на сложность глубины и на 20 байт / пиксель
1024 x 768 x 2,5 байта / кадр 39,3 Мбайт на кадр x 60 кадров в секунду = 2,4 ГБ / сек рендеринг с более высоким разрешением,
более высокой частотой кадров или более высокой глубиной сложности может оказать значительное влияние на требования к
пропускной способности памяти. Перемещение разрешения до 1600 x 1200 пикселей: горизонтальное разрешение x
вертикальное разрешение x глубина сложности x 20 байт / пиксель

NVIDIA Corporation |4
1600 x 1200 x 2.5 x 20 = 96,000,000
bytes/frame

96Mbytes per frame x 60 frames per second = 5.8GB/sec

Такие огромные объемы пропускной способности памяти могут быть достигнуты только с широкими системами памяти (128 бит)
и высокоскоростными памятями. Сегодня, как правило, используется двойная скорость передачи данных, или DDR, память. Даже
с такими продвинутыми подсистемами памяти пропускная способность буфера кадров является одним из ключевых
ограничителей для увеличения разрешения и/или частоты кадров графических приложений. Повышая эффективность
визуализации пикселей графическим процессором, можно добиться значительного повышения производительности без
увеличения пропускной способности памяти буфера кадров. Благодаря повышению скорости буфера кадров (а следовательно, и
пропускной способности памяти) и повышению эффективности визуализации пикселей становятся возможными значительные
прорывы в производительности и качестве изображения. GeForce3 реализует оба метода для достижения такого прорыва.

Прорыв Пропускной Способности Пиксельной Памяти GeForce3

GeForce3 реализует множество запатентованных технологий для повышения эффективности визуализации пикселей. Три из этих
ключевых технологий-это контроллер памяти на основе кроссбара для повышения эффективности доступа к буферу кадров,
сжатия z-буфера без потерь, а также для уменьшения сложности глубины прорисовки и, таким образом, уменьшения количества
пикселей, которые должны фактически считываться и записываться в буфер кадров.
Контроллер памяти Crossbar

Контроллер памяти-это, пожалуй, один из самых важных компонентов любой графической системы. Поскольку 3D-графика
настолько зависит от пропускной способности памяти, контроллер памяти является главным узким местом для повышения
производительности. Помимо графического процессора, другим важным компонентом графической системы является буфер
кадров. Буфер кадров, который является памятью, подключенной непосредственно к графическому процессору, содержит такую
информацию, как цвет, значения глубины, текстуры и геометрия, и обычно является самой высокой пропускной способностью
системы памяти в персональном компьютере. К сожалению, это самая дорогая часть типичной графической системы, часто
составляющая 50% от стоимости продукта или более. Поэтому крайне важно максимально эффективно использовать этот
дорогостоящий ресурс.

Традиционные контроллеры памяти достигли той точки, когда они достаточно эффективны при базовых нагрузках, получая в
большинстве случаев более 50% пиковой пропускной способности памяти из буфера кадров. В современных системах с двойной
скоростью передачи данных (DDR) типичный 128-битный контроллер памяти фактически получает доступ к информации в 256-
битных “кусках” (поскольку DDR передает вдвое больше информации за один доступ). Хотя казалось бы, что передача больших
объемов данных в больших блоках обычно оптимальна, на самом деле при сложных сценах с сотнями тысяч полигонов на кадр
реальность на самом деле совершенно иная.
В условиях, характерных для последнего поколения интерактивного контента, размер среднего треугольника (основного
строительного блока всех графических объектов реального времени) может быть очень мал, иногда всего несколько пикселей.
Если треугольник имеет размер, возможно, 2 пикселя и состоит из 32 бит цвета или z для каждого пикселя, то общий объем
данных для этого треугольника будет равен 32 битам x 2 пикселям, или 64 битам. Если бы контроллеры памяти получали
доступ к информации только в 256-битных "кусках“, то большая часть этого доступа была бы потрачена впустую, поскольку
эта” полезная нагрузка" или объем передаваемых данных по существу растратили бы большую часть потенциальной
пропускной способности кадрового буфера. В этом примере традиционный 128-битный контроллер памяти был бы эффективен
только на 25%, "растрачивая" 75% пропускной способности памяти.

NVIDIA Corporation |5
GeForce3 реализует радикальный контроллер памяти crossbar, который оптимизирован для доступа к буферу кадров с тонкой
схемой детализации доступа, с возможностью индивидуального доступа до 64 бит, гарантируя, что каждый индивидуальный
доступ полностью эффективен, таким образом гарантируя, что ни одна часть пропускной способности буфера кадров не будет
потрачена впустую. В то время как сам контроллер памяти все еще способен получать доступ к 256 битам информации в
индивидуальном тактовом цикле, эффективность каждого из этих обращений почти идеальна, сохраняя все аспекты
графического процессора и его буфера кадров полностью используемыми для максимальной производительности.

Он делает это, эффективно реализуя четыре


независимых контроллера памяти, каждый из
которых взаимодействует друг с другом и с
остальной частью графического процессора.
Эта сложная система постоянно балансирует
нагрузку, чтобы гарантировать, что каждый
аспект системы памяти сбалансирован и что все
запросы памяти графическим процессором
обрабатываются должным образом. При
сложных нагрузках, характерных для контента
следующего поколения, контроллер памяти
поперечины GeForce3 может быть в четыре
раза эффективнее предыдущих менее
интеллектуальных конструкций.

Сжатие Z без потерь

Z-буфер представляет собой информацию о глубине или видимости для пикселов, которые в конечном итоге будут отображаться
после рендеринга. Традиционные графические процессоры считывают и потенциально записывают данные z для каждого пикселя,
который они визуализируют, что делает трафик z-буфера одним из крупнейших “потребителей” пропускной способности памяти
в графической системе. При реализации усовершенствованной формы сжатия данных без потерь 4:1 пропускная способность
памяти, потребляемая трафиком z-буфера, уменьшается в четыре раза. Это сжатие z реализовано в аппаратном обеспечении
прозрачно для приложений, причем как сжатие, так и декомпрессия происходят в режиме реального времени с помощью z-
компрессионных/декомпрессионных движков архитектуры памяти Lightspeed. Поскольку это сжатие полностью без потерь, то
нет никакого снижения качества изображения или точности. Результатом этой технологии является значительно более
эффективное использование полосы пропускания памяти для значительного повышения производительности без ущерба для
качества изображения.

NVIDIA Corporation |6
Подсистема видимости: Z-окклюзионная отбраковка

Как уже обсуждалось ранее, традиционные графические архитектуры визуализируют каждый пиксель каждого треугольника по
мере его получения, получая доступ к буферу кадров с каждым пикселем, чтобы определить соответствующие значения для цвета
и z (или глубины) для каждого из этих пикселей. Этот метод дает правильные результаты, но требует, чтобы все пиксели были
визуализированы, независимо от их видимости или нет. Типичный контент сегодня имеет среднюю сложность глубины два, что
означает, что для каждого пикселя, который в конечном итоге становится видимым, два пикселя должны быть визуализированы (в
среднем), чтобы получить этот результат. Это означает, что для каждого видимого пикселя графический процессор вынужден
обращаться к буферу кадров дважды, тратя ценную пропускную способность буфера кадров, по существу, визуализируя пиксели,
которые зритель никогда не увидит.
GeForce3 реализует сложную технологию отбраковки z-окклюзии, с помощью которой он пытается заранее определить, будет ли
пиксель в конечном итоге видимым. Если пиксель собирается быть окклюзированным и блок отбраковки z-окклюзии определяет
это, пиксель не визуализируется, буфер кадров не доступен, и пропускная способность буфера кадров сохраняется. В
зависимости от глубины сложности сцены это может означать огромное повышение эффективности. При сегодняшнем
содержании, усредняющем сложность глубины примерно в два раза, этот метод может снизить требования к пропускной
способности на 50%. С содержанием следующего поколения, приближающимся к глубинным сложностям четырех или более,
преимущества могут быть огромными, с повышением эффективности пропускной способности памяти до четырех раз.

Дополнительным приемом, который могут использовать разработчики, является "окклюзионный запрос". По существу,
приложение делает запрос графическому процессору на визуализацию ограничивающего прямоугольника или области для
проверки видимости. Если графический процессор определяет, что область будет закрыта, то вся репрезентативная геометрия и
рендеринг, представляющие эту область, могут быть пропущены, потенциально предлагая увеличение скорости заполнения на
порядок. Персонажи за стенами или декорации за пределами туннеля могут быть просто "окклюзионно запрошены" и
пропущены, не тратя драгоценную пропускную способность памяти или время обработки GPU для их визуализации.

Эти две ключевые технологии эффективно увеличивают пропускную способность графического процессора GeForce3, как за счет
получения значительно большей эффективности от пропускной способности памяти, обеспечиваемой буфером кадров, так и за
счет более эффективного использования буфера кадров, избегая необходимости доступа к нему для пикселей, которые не были бы
видны. В некоторых случаях каждое из этих преимуществ может демонстрировать вчетверо большую производительность, чем
предыдущие архитектуры, в то время как на практике типичное преимущество этих технологий усиления пропускной способности
памяти составляет в среднем 50% -100% улучшения.

Архитектура Памяти Geforce3 Lightspeed

GeForce3 предлагает целый ряд технологий для решения проблемы пропускной способности памяти. Представляя сложную
геометрию как поверхность высокого порядка и выполняя эти поверхностные вычисления полностью на графическом процессоре,
GeForce3 может избежать передачи огромных объемов данных треугольника по шине AGP, гарантируя, что связь между хостом и
графическим процессором может продолжаться эффективным и высокопроизводительным образом. Решая проблемы пропускной
способности пикселей различными способами, GeForce3 приподносит огромный скачок в эффективности пропускной способности
памяти для компьютерной графики. Сочетание самого эффективного и сложного контроллера памяти на основе crossbar-based,
когда-либо созданного для компьютерной графики, продвинутого сжатия z без потерь для снижения потребления шины пропуска и
высокоразвитого метода, позволяющего избежать рендеринга и расходования шины пропускания на невидимые пиксели, означает,
что GeForce3 использует полосу пропускания памяти в два раза больше, чем любая предыдущая традиционная архитектура.

Эти достижения открывают путь к все более динамичному и визуально богатому опыту работы с 3D-графикой в реальном времени.
Повышая эффективность связи между хостом и графикой, разработчики контента могут продолжать увеличивать геометрическое
богатство и визуальную сложность своих сцен до новых уровней, не связанных ограничениями шины AGP. Рендеринг с высоким
разрешением и высокой частотой кадров становится стандартом для GeForce3, поскольку его достижения в области рендеринга
пикселей и эффективности памяти означают что границы полосы пропускания буфера кадров были нарушены, что впервые
открыло путь для 32-битного рендеринга с высоким разрешением без существенных провалов производительности.

NVIDIA Corporation |7
Приложение

Разрешение
Разрешение-это количество пикселей на экране. Более высокие разрешения могут создать более реалистичную 3D-среду,
поскольку можно отобразить больше деталей сцены. Большинство современных дисплеев способны отображать не менее 1280
горизонтальных пикселей на 1024 вертикальных пикселя, в то время как многие большие или более дорогие дисплеи способны
отображать 1600x1200 или даже 2048x1536 пикселей. Большинство графических приложений поддерживают различные
разрешения, что позволяет конечному пользователю работать с более высоким разрешением (и, следовательно, более высоким
уровнем детализации), при этом компромисс заключается в увеличении нагрузки на систему обработки графики.

Битная глубина
Битная глубина относится к числу битов точности для цвета и z-значений, связанных с каждым пикселем на экране.
Дополнительные биты точности улучшают визуальный реализм и точность визуализируемого кадра. Две наиболее
распространенные битовые глубины в современном графическом оборудовании - это 16 бит и 32 бита. Каждое из этих значений
может быть связано с цветом или z-значениями. 32-разрядный цвет (например) обычно используется для представления
красного, зеленого, синего и Альфа-значений (или прозрачности) с размером до 8 бит на компонент или 256 “значений” для
каждого из этих компонентов. 32-разрядное z-значение обычно выделяется в виде 24 бит точности z (или точности глубины) и 8
бит точности трафарета или “маски”.

Частота кадров в секунду


(fps), или частота кадров, относится к тому, сколько раз в секунду сцена обновляется графическим процессором. Более высокие
частоты кадров дают более плавную и реалистичную анимацию. Общепризнано, что 30 кадров в секунду обеспечивают
приемлемый уровень анимации, но увеличение производительности до 60 кадров в секунду приводит к значительному улучшению
взаимодействия и реализма. За пределами 75 кадров в секунду трудно обнаружить какое-либо улучшение производительности.
Отображение изображений быстрее, чем частота обновления монитора, приводит к потере вычислительной мощности графики,
поскольку монитор не может обновить свои люминофоры (или дисплей) так быстро, что по существу тратит частоту кадров
сверх своей частоты обновления.

Сложность глубины
Сложность глубины-это мера сложности сцены. Это относится к количеству раз, когда любой данный пиксель должен быть
отрисован, прежде чем кадр будет сделан. Например, визуализированное изображение стены имеет сложность глубины, равную
единице. Изображение человека, стоящего перед стеной, имеет глубину сложности в два раза больше. Изображение собаки позади
человека, но перед стеной имеет глубину сложности три, и так далее. По мере увеличения сложности глубины для визуализации
каждого пикселя или сцены требуется больше мощности рендеринга и пропускной способности. Средняя глубина сложности
современных графических приложений составляет от двух до трех, что означает, что для каждого пикселя, который вы в
конечном итоге видите, он визуализируется два или три раза графическим процессором.

NVIDIA Corporation |8
Отображение текстур

Отображение текстур-это метод проецирования 2D-изображения (обычно растрового) на 3D-объект. Сопоставление текстур
позволяет существенно увеличить визуальную детализацию без существенного увеличения количества полигонов. Из-за
улучшенного реализма, который может быть получен при очень небольшом увеличении вычислительных затрат, отображение
текстур является одним из наиболее распространенных методов отображения реалистичных 3D-объектов. Для того чтобы
отобразить пиксель с отображением текстуры, данные текстуры для этого пикселя должны быть считаны в графический
процессор, потребляя пропускную способность памяти.

Скорость заполнения

Скорость заполнения-это скорость, с которой пиксели втягиваются в память экрана. Скорость заполнения-это распространенная
мера, используемая для иллюстрации возможностей обработки пикселей современных 3D-графических процессоров. Скорость
заполнения обычно измеряется в миллионах пикселей в секунду (Mpixels/sec). В 1997 году 50-70 Мпикселей/сек считались
самыми современными. В 2001 году ведущие 3D-графические процессоры будут способны развивать скорость 800-1000 Мп / с.
Хотя это улучшение является невероятным достижением, его едва хватает для создания привлекательной 3D-среды. Рендеринг
пикселей с такой высокой скоростью может потреблять огромное количество пропускной способности памяти.

Пропускная способность памяти

Пропускная способность памяти относится к скорости, с которой данные передаются между графическим процессором и
графической памятью. Ограничения пропускной способности памяти являются одним из ключевых узких мест, которые
необходимо преодолеть, чтобы обеспечить действительно реалистичную 3D-среду. Для создания действительно потрясающего
3D-изображения требуется высокое разрешение, 32-битная глубина цвета при высокой частоте кадров, богатая геометрия,
сложное отображение текстур и сложное затенение вершин и пикселей.

NVIDIA Corporation |9