[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]

Файл: 220px-Cray_YMP_M90_Ziegler_3.jpg -(17 KB, 220x293, 220px-Cray_YMP_M90_Ziegler_3.jpg)
17 No.215784  

По устаревшей системе производительность компьютеров измеряется в "операциях" в секунду.
Но что подразумевается под Операцией? При этом в современных компьютер есть к примеру - выполнение операции за такт, от двух и больше.
А по натуральным суперкомпьютерам - Флоатинг Поинт Пир Секонд.
То есть, операции с плавающей точкой в секунду.
Выходит что производительность адаптируется под определенные задачи?
Тогда выходит, что самые быстрые компьютеры по определенному назначению могут и в чем-то отставать?
Ведь в гонках на лидерство можно и идти на ухищрения, просто для расположения строчки в рейтинге?
Как говорится - На деле пень простой, либо лев без гривы.
Такие дела.

>> No.215785  
> Выходит что производительность адаптируется под определенные задачи?

Да.

> Тогда выходит, что самые быстрые компьютеры по определенному назначению могут и в чем-то отставать?

Исторически, кстати, узкоспециализированные компы появились раньше компьютеров общего назначения.

>> No.215787  
Файл: 9800GT_fwhq(4).jpg -(1612 KB, 2000x967, 9800GT_fwhq(4).jpg)
1612

Компьютер НАСА как-то умудряется моделировать тёмную материю.
А вот как на счёт рытья песка триллионом тракторов?

>> No.215795  

Говорит ОП.
Грубоватое сравнение, однако мне работа узлов процессора чем-то напоминает ДОМИНО(в смысле эффекта цепочки падающих доминошек).

>> No.215805  

Глобально итоговая проблема вообще в том что непонятно в каких попугаях оную вообще мерять. Оных просто нет абсолютно универсальных.
Даже компьютер общего назначения, тот самый что ни на есть самый раздомашний/офисный - это в итоге объединение спецвычислителей в одном устройстве, "развесовка" этого объединения может, и обычно, бывает разная, и в итоге что-то одно лучше делает одно а что-то другое - своё другое. При том что по тем-же гигафлопсам (подсчёта числа Пи) обе системы могут давать идентичные результаты.

>> No.215814  
Файл: 1789893944_w640_h640_suprotec-vosstanovlenie.jpg -(142 KB, 960x1280, 1789893944_w640_h640_suprotec-vosstanovlenie.jpg)
142

"Высокопроизводительные вычисления используют там, где нужно обрабатывать колоссальные объёмы данных, применяя очень сложные алгоритмы. Обычным компьютерам на решение таких задач понадобятся недели и даже годы."
На деле у параллелизма есть множество применений. К примеру расчёт плотности движущегося вещества в физических ускорителях частиц. Моделирование гидродинамики сжатого газа в холодных цистернах. Конвекция тлеющего водорода во внешних слоях красных карликов.

>> No.215823  

>>215814
Моделирование скопления звёзд по 1000 слоёв конвекции.

>> No.215863  

Для типичных задач компьютер/ии - выделяет несильно-большой промежуток от имеющейся памяти. То есть если в компьютере и установлено 4 гб, то по большему счёту из всего объёма будет использоваться всего 1.25.

>> No.215864  

>>215863
Ты откуда такой вылез? Процесс ест столько, сколько ему нужно. И если столько нет - попросту вылетает. В современных ОС процессов дохрена. Но это не значит, что все они лезут в процессор одновременно. Редко какому процессу нужна ВСЯ оперативка, но практика показывает, что рано или поздно натыкаешься на задачу, которой МАЛОВАТО БУДЕТ. Ну или комбинацию задач, типа просмотра нескольких вкладок современного интернета. Так что, да, в среднем после загрузки ОС у тебя занят гигабайт, но стоит начать что-то делать, и не хватит вообще никаких объемов.

>> No.215865  

>>215864

>вылетает.

Логично. На деле можно перекинуть в буфер жёсткого диска и загружать данные поэтапно. Это медленнее но работает.
А то как-то игори выживали на слабых видеокартах. Никаких вылетов, но всё идёт с тормозами.

>> No.215867  

>>215865
Не, своп - это тоже память. Хотя и медленная. Приложения получают память от ОС, и не знают, где она - в RAM или свопе. А вот если запросят больше, чем осталось суммарно - вылетят.
А игры вылетали и до сих пор вылетают подчас. Просто обычно памяти по шейдеры надо сильно меньше, чем GPU способен прожевать, даже с тормозами. Игра обычно проверяет перед загрузкой сцены, сколько есть, и если не хватает - урезает текстуры до меньших разрешений (ну еще есть разные трюки с динамической подгрузкой, что отражается фризами). Но иногда не проверяет, или не находит подходящего размера и вылетает. Чаще всего такое происходит с приставочными портами.
И, да, видеопамять на самом деле память под шейдеры, и оперативка под программы и данные, которые в процессоре крутятся - это разная память. Хотя на встроенных видеокартах видеопамять выделяется из основной, ОС не может так просто ее перераспределять динамически.
Вобщем, тебе надо коммон-сиенс почитать по устройству компьютера. Хрен его знает, есть ли сейчас какой-то актуальный аналог пресловутого "профессора Фортрана" для самых маленьких.

>> No.215868  

>>215867
Ты никогда не встречал как работает с графикой Интел? Текстуры мыльного цвета отрисовать - вот и прирост производительность. Не новость что подобным образом ЦП может обрабатывать данные. Тут ко всему объёму памяти и нет смысла обращаться.
Современный ии компьютера учится обобщать, а ещё он любит быстро думать. Потому не будет затрачивать полные усилия для решения неликвидных задач.
Он быстренько рассортирует всё по полочкам, современные алгоритмы в скором времени вообще не будут требовать много памяти.
У меня есть мобилка с гигом оперативы, ось грузит всего 350мб., крутит без тормозов неконвертированное mkv.
Есть ещё американская военная поговорка - тупица, делай проще.(kiss - keep it semple, stupid)
Так что следует учесть, что юзать постоянно полный объём памяти - для машин нонсенс. Всеравно что каждый раз перечитывать полную книгу Чуковского, вместо того чтоб быстро вспомнить пару куплетов из Айболита и Бибигона.

>> No.215872  

Немного поправлю
>>215867
Виндо-ОСь (да и любая современная мнгозадачная) даёт приложению (программе) столько памяти, сколько она простит.
Бывают конечно пограчничные
Прога хочет столько ОЗУ, сколько ОСь ей не может дать на архитектурном уровне (например на 98й винде пробовать занять более 3х гб озу)
Проге надо часто, много, и она всем этим пользуется, а реальной ОЗУ в компе мало - тут ОСь может отказывать в выделении памяти т. к. не только твоей проге она нужна вот прямо сейчас, а выделить не в подкачке сейчас операционка не может - не все программы готовы к таком повороту (и падают) ... С некоторыми готовыми к таким поворотам программами - падает операционка.
Кстати прога при желании может узнать где она - в RAM или свопе, а ещё намерено рекомендовать ОСи отправить кусок запрошенной своей памяти в своп, как и запросить обратное действие.
видеопамять - не оперативка.
Если туда что-то не лезет (или попросту не надо т.к. к примеру, отображаемый трёхмерный бъект - удалённый) туда может быть загружена сильно меньшеная версия текстуры, а если нет готовой маленькой - уменьшена из большой (типично силами ЦП, но от конкретного 3Дэ движка зависти) и загружена.
....
А что имел в виду ОН: >>215863
Не знаю.
Если в общем, на твой запрос выделить n-ное число байт памяти, ты обычно получишь n+сколько-то-там сверху т.к. машина не умеет выделять оперативку куском произвольного размера, только погонными ломтями штатного размера (для ОЗУ на x86 компах - кусками по 4кило -/+ промежуточный программный менеджер (из MSVCRT к примеру) умеющий накрошить тебе их виртуальными кусочками поменьше, но тоже ломтями а не ровным числом байт)

>> No.215873  

>>215872
Видеокарта может запросить часть памяти у ЦП, у видеокарты схемы памяти чуть-ли не идентичным тем что у компа.(по состоянию на время релиза) Так что немного полегче.

>> No.215882  

>>215873

> Видеокарта может запросить часть памяти у ЦП

Не работает в случае вычислений на CUDA, а потому для нейросеток нужно много VRAM.

>> No.215884  

>>215882
Нормальной нейросети хватит для общих задач и 512мб, так что поняти "много" тут сильно обобщённое. Нейросеть и под ЦП написать можно. Там будет памяти по-горло, а вот нужно ли ей столько - уже хз.

>> No.215889  

>>215884

> Нормальной нейросети хватит для общих задач и 512мб

Для генерации анимушных картиночек в высоком разрешении надо не менее 12 гигов VRAM.

> Нейросеть и под ЦП написать можно.

ЦП плохо умеют в параллельные вычисления одной большой задачи, ибо заточены под быстрое переключение между кучей сразу.

>> No.215891  
Файл: 7622f4054862579bc66fbdc55bf179d3.jpg -(394 KB, 800x600, 7622f4054862579bc66fbdc55bf179d3.jpg)
394

>>215889
Аниме картинки - это общие задачи? Что-то мне так не кажется.
ЦП использует видики в качестве сопроцессора. Сейчас ЦП+видеокарта устоявшийся концепт компьютера. Однако векторные(параллельные) сопроцессоры давно встроенны в сам процессор, с учётом того, что процессор - ядер на 6 - это уже векторная машина.

Спасибо за интерес к треду. Мне тоже интересно чем конкретно отличаются ЦП от видеокарт по возможностям. Знаю только что компьютер Summit выполняет симуляцию термо-синтеза в реакторах.

>> No.215894  

>>215891

> с учётом того, что процессор - ядер на 6 - это уже векторная машина.

А у ГП несколько сотен ядер.

> Мне тоже интересно чем конкретно отличаются ЦП от видеокарт по возможностям.

ЦП может быстро переключаться между задачами, а ГП — нет.

>> No.215895  

>>215894

>сотен ядер.

Количество транзисторов говорит о том что это ТРЫНДЁЖЬ.
Так что сравнение слабое.

>> No.215897  

>>215895
Citation needed
Алсо, количество транзисторов не говорит ни о чем.

КМК, у нас поехавший завелся. Причем еще более чем хлебопечка-кун.

>> No.215898  

>>215897О, точно, накидай гайды для хлебопечки

я тоже пекарь-куном заделаться хочу

>> No.215918  

>>215863
Неправда. Смотря что ты подразумеваешь под "типичной задачей", для игровой пеки типичной задачей будут, внезапно, игры, которые спокойно будут мапить гигабайт по 12 на ядро.

Научные вычисления жрут примерно 300 метров на ядро.

>> No.215919  

>>215897
Видно аргументы уплыли. Понятно.

>> No.215925  

Предлагаю забанить вот этого >>215919. И ОП-а тоже.

>> No.215926  

>>215925
Предлагаю покинуть тред. Спасибо.

>> No.215927  

>>215926
Пожалуйста. Не забудь убрать за собой.

>> No.215928  

>>215927
Ты бы поменьше конфликтовал, и больше писал по делу.
Количество блоков управления процессора(резисторы, транзисторы) - по большему счёту решающий фактор производительности.
На то и кукурузные частоты влияют меньше, чем количество ядер.

>> No.215929  

>>215928
Гу поясни нам за трантзикторы-резикторы, раз такой умный.

>> No.215930  

>>215929

>умный.

Ты меня в чём-то упрекаешь?
Поищи в Гугле значения АЛУ, триггер и регистр. Может поймёшь что к чему.

>> No.215934  

>>215873
Не может.
На высшем программном уровне АПИ (DirectX) для оконечного потребителя (за счёт виртуализации создаваемой операционкой) создаётся такая видимость, но на железном уровне у ГПУ есть только своя местная оперативка, в общесистемную он может что-то затолкать/вытолкать по DMA, но это нисколько не похоже на доступ к ОЗУ (это похоже, доступно, на а-ля операцию копирования файла между локальным диском и сервером по ФТП)
>>215891
Встроенное видеоядро не чета даже не совсем топовой дискретной видео, просто банально ибо "А у ГП несколько сотен ядер."(c)>>215894
>>215894

>ЦП может быстро переключаться между задачами, а ГП — нет.

Не совсем. Не настолько.
Точней:
Все ядра ГП могут выполнять только одну и ту-же задачу (решать один и тот-же набор математических вычислений, только значения переменных x,y,z,m,k,i,j,,,,в условии каждому ядру можно задать свои)
У ЦП каждому ядру можно задать свой персональный набор математических вычислений. Нет, ну там есть ещё MMX, SSE, AVX c аналогичным ГП подходом к заданию условий, но число имеющихся MMX юнитов даже близко не сотня.
А ещё у ядер ГП своеобразная математика, они специализированные для решения задач надевания пространственных крашеных полигонов на плоскость, и как ЦП работать они вообще не умеют, не содержат достаточного для того набора инструкций.

>Количество транзисторов говорит о том что это ТРЫНДЁЖЬ

И да, число транзиков, особенно между вычислителями различного назанчения, в общем случае мало о чём говорит, ибо для решения одного и того-же применяется разная схемотехника, а в спецвычислителях так и вообще не одни только вентили (умеющие быть только в 0 или в 1).

>> No.215939  
Файл: 3_4.jpg -(449 KB, 1488x1984, 3_4.jpg)
449

>>215934
Ну в общем-то видеокарту пока не научили только де/компрессить рар архивы. А вот перекодирует видео уже совместно с процессором. Что для снятия нагрузки с процессора вообще сказка.
Так что от видеокарт таки есть польза, когда это нужно.
На счёт транзисторов, аналогично количеству ядер - больше-лучше.
ОП.

>> No.215946  

>>215939
Ты все еще не способен нагуглить количество транзисторов?

>> No.216023  
Файл: images (19)_111419.jpeg -(9 KB, 259x194, images (19)_111419.jpeg)
9

Господа. Правда ли что нейросети на разном оборудовании и на разном программном обеспечении - по разному обобщают?
Так сказать, разные возможности абстрактного мышления.

>> No.216024  

>>216023
Нейросеть сама по себе является программным обеспечением, вопрос непонятен.

>> No.216026  

>>216024
А если понятно?

>> No.216029  
Файл: 70001923_p0_master1200.jpg -(777 KB, 845x1200, 70001923_p0_master1200.jpg)
777

>>216026
Тогда пусть отвечает тот кому понятно

>> No.216030  

>>216029
Если б всё зависило только от программы, то ни-каких бы архитектурных различий между железом небыло. Тут даже с точки зрения рынка конкуренции понятно, что какие-то различия всё-же есть, и различия тут не только в тактовых частотах и разбросе производства.
Вспомним те-же 3dnow, x86, x64, sse, avx.
Надеюсь, ты со мной хотя б в какой-то мере согласен.
Тут есть даже различия у носителей информации, как к примеру разработка от SanDisk - 4 бита на ячейку.

>> No.216031  

>>216030
Под Arm, x86, и x64 пишется разный код. Что уже говорит о том, что разные процессоры могут иметь различия в способах соображения.

>> No.216032  

>>216030
Нейросети как таковые, их логика абстрагируются от конкретного железа в любом случае в моем понимании, слишком высокоуровневый софт. Так что конечно конкретная процессорная архитектура не должна влиять на их работу. Другое дело, что в зависимости от быстродействия железа или даже ОС на котороq они работают возможны какие-то сайд эффекты. Но это мне кажется, очень сложно доказать.

>> No.216033  

>>216032
А почему ты так считаешь?

>> No.216034  
Файл: 06.15.2021-4-3.jpg -(240 KB, 1200x600, 06.15.2021-4-3.jpg)
240

>>216033
Как говорится - единство в многообразии.
Я когда-то пытался углубиться в компонентное строение микроархитектуры процессоров.
Потому и создалось впечатление, что разное железо может работать по разному.
В доказательство тут к примеру факт того, что к разному железу идут разные драйвера.
Ты не установишь под amd radeon драйвер от nvidia.
Тут параллель можно провести даже с автомобилями, они ездят, но мотор рычит по разному, управляемость разная.
Программа тут как топливо, записанное на диск. Хотя и топливо если по делу понятно - электричество.

Говорить что железо одинаково, свойственно по большей мере программистам, которым просто комфортно так считать.
Но даже программистам понятно что для оптимизации работы программ, немного нужно знать о свойствах архитектуры железа.
Мне же выгодно смотреть с такой с тороны, потому что хочу заняться своей настройкой обработки информации. То-есть я уже знаю, какой приблизительно вывод сделают машины, прореагировав на определенный пазл настройки их возможностей.
Выгодно то, что для подобных задач не требуется собирать груду железа в виде кластеров. А просто адаптировать устройство нужными файлами, или добавить текст с необходимыми калибровками. А искусственный интеллект попробует что-то добавить, внести свои корректировки, и как итог - сделает мир интереснее.

>> No.216035  

>>216033
Крысиная(или змеиная) жажда. Кратко говоря. Ну или как-всегда.

>> No.216036  

>>216033
Почему я считаю что логика высокоуровневой программы абстрагируется от железа? Или что? Если все-таки первое, то это самоочевидно, в том случае если программа должна более-менее одинаково работать на разных архитектурах. Программа может работать быстрее или медленнее(или вообще не работать), но в случае ее работоспособности то что она делает не изменится от того на каком именно процессоре она работает. Как-то так

>> No.216037  

>>216036
Ты подразумеваешь - разный код - одинаковый способ выполнения(при одинаковой программе). Верно?
Мне интересно получить результат обработки данных из набора разных архитектур.
Просто такой подход как по мне самый интересный. Тут сопоставимо с пословицей о том что - всё в жизни пригодится. То есть имея в наличии сильную видеокарту, хотелось бы чтоб в ящике была и пара слабых.
По опыту скажу что с такой настройкой меньше упустишь из виду.

>> No.216038  

>>216037

> Ты подразумеваешь - разный код - одинаковый способ выполнения(при одинаковой программе). Верно?

Высокоуровневый код может быть одинаковым и на 100%. В случае с собственно нейросетками это именно так, кроссплатформенность обеспечивают внешние(по отношению к логике самой нейросетки) модули какие-то. Их код таким образом абстрагирован от особенностей архитектуры и работает везде где он должен работать.

>Мне интересно получить результат обработки данных из набора разных архитектур.

Крайне сомнительно что удастся провести какие-то закономерности, но вообще-то выборка не должна зависеть от железа. Учитывая сложность и неоднозначность работы некоторых сеток действительно возможны какие-то сайд-эффекты, но обнаружить их будет сложно. Такие сетки и при одинаковом запросе могут выдавать совершенно разные данные.

>> No.216040  

>>216038
Посмотрим как всё сложится. Спрос не ударит в нос.

>> No.216041  

От части моё любопытство навела информация - "слабая и сильная нейросеть". Как-то так.

>> No.216042  
Файл: I have a bad филин about this.jpg -(67 KB, 600x1000, I have a bad филин about this.jpg)
67

А вот интересно мнение: есть ли смысл брать нормальную (и, соответственно, дорогую) матплату на АМ5 с нормальной же видеокартой (6800ХТ, например) и потом, лет через пять, поменять процессор и видеокарту на что там будет у амуды актуальным? Опасаюсь, что они могут быстро забросить поддержку этого сокета. Дичайший 7800X3D выходит в апреле, кстати.
Пиктуре партиаллы релатед.

>> No.216043  

>>216042
Будущее не предопределено, так что выбирай то что нравится сейчас.

>> No.216046  

>>216042
Можно спросить что означает эта провокация на картинке? Прям захожу в тред, и терплю. (ОП)

>> No.216047  

>>216046
Разрешаю не терпеть, удалить тред и никогда больше на Ычан не писать.

>> No.216048  
Файл: unnamed (16)_111815_111820.jpg -(45 KB, 512x342, unnamed (16)_111815_111820.jpg)
45

>>216047
А что ещё? Ну действительно.

>> No.216078  

Можно применить термин - "логические возможности". К видеокартам и центральным процессорам. И таким образом более подробно описать свойства работающих на них программ.

>> No.216081  

Внесу в тред.
На одном и том же языке,
Одна и та-же программа может быть написана приблизительно разным способом. По этому не всегда есть смысл заучивать каждый сегмент кода.
Другое дело, как этот код понимает железо.
С точки зрения программиста лучшее железо самое новое что подешевле, чем старое но топовые.
Это по впечатлениям.
С достаточным опытом в программировании может быть достаточно и довольно-древнего барахла.
Если за массив определять многоэлементное железо, то перевес будет по большему счёту в пользу видеокарт, на которых рассчитано параллельное программирование. Торговое железо будет отличаться только скоростью счисления.
Потому по моим меркам было б добротно собрать тихий компьютер на непрожорливых компонентах.

>> No.216082  

У компьютеров есть подпрограмма контроля, хода выполнения программ.
ОП.

>> No.216083  

Суперкомпьютеры должны работать по принципу введения в цикл(дублирование) кода выполняемых программ.
Я всё правильно понял?
То есть в принципе быстро прогоняет данные через себя.




[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]