Ядра, мегагерцы - что и как влияет на производительность.

Dmitry Stepin

In trance me trust
12 Янв 2004
16.638
12.211
113
40
Москва
t.me
Доброго времени суток! На проведение этого небольшого исследования меня сподвигло желание недорого поменять мой i7-4930k на xeon e5-2690 v2. Но, поскольку мой 4930к, обладая 6-ю ядрами, в режиме 24/7 работает на 4,3 ггц, а зион 2690 v2, являясь 10-ти ядерным, работает на частоте 3 ггц, я захотел проверить, что я приобрету и потеряю при переходе с шести быстрых ядер на более медленные десять. Для этого я сделал три разных теста, в которых попытался учесть важные для меня рабочие моменты.

  • 1. тест на количество t-racks stealth limiter в 16-ти кратном оверсемплинге, с нагрузкой на одно ядро и на все ядра.

  • 2. тест на количество инстанций/голосов lush-101 (патч altered reality, пять голосов в каждой инстанции, мультипроцессинг в настройках луша включён)

  • 3. аналогичный второму тест, только все lush работают через Vienna Ensemble Pro 5

  • 4 и самое для меня важное - поскольку и 4930к, и зион 2690 v2 относятся к одному и тому же поколению процессоров ivy bridge-e, я подумал, что смогу более точно узнать пользу от четырёх дополнительных ядер зиона, проведя все тесты на двух активных ядрах моего 4930 и на шести. Не знаю, насколько это соотносится с реальностью, но в теории выглядит весьма правдоподобно))

Все тесты я решил провести на трёх вариантах задержки - 64, 128 и 256 семплов, а также в трёх вариантах настройки асио гарда. Красивые таблицы я делать не умею, поэтому результаты будут не супер-удобно читаемыми =( В скобках указано количество задействованных ядер/потоков для каждого результата. Для определения максимального количества инстанций каждый тест нагружался до треска или полного пропадания звука с последующим отключением одной, последней включённой инстанции. Семплрейт везде 48000 гц.

Итак, погнали:


  • 64 - 4 (1C\1T) 24 (6C\12T)
    128 - 5 (1C\1T) 24 (6C\12T)
    256 - 5 (1C\1T) 24 (6C\12T)
  • AG low - 5 (1C\1T) 24 (6C\12T)
    AG med - 5 (1C\1T) 25 (6C\12T)
    AG high - 5 (1C\1T) 26 (6C\12T)
  • 64 - 3 (1C\1T) 12 (6C\12T)
    128 - 3 (1C\1T) 13 (6C\12T)
    256 - 3 (1C\1T) 13 (6C\12T)
  • AG low - 3 (1C\1T) 14 (6C\12T)
    AG med - 3 (1C\1T) 14 (6C\12T)
    AG high - 3 (1C\1T) 15 (6C\12T)
  • 64 - 3 (1C\1T) 9 (2C/4T)
    128 - 4 (1C\1T) 9 (2C/4T)
    256 - 5 (1C\1T) 10 (2C/4T)
  • AG low - 5 (1C\1T) 11 (2C/4T)
    AG med - 5 (1C\1T) 11 (2C/4T)
    AG high - 5 (1C\1T) 12 (2C/4T)
  • 64 - 19 (VEP 5 - 16)
    128 - 23 (VEP 5 - 20)
    256 - 25 (VEP 5 - 24)
  • AG low - 28
    AG med - 28
    AG high - 29
  • 64 - 13 (VEP - 12)
  • 128 - 15 (VEP - 15)
    256 - 18 (VEP - 17)
  • AG low - 18
    AG med - 19
    AG high - 20
  • 64 - 8 (VEP - 6)
    128 - 9 (VEP - 8)
    256 - 10 (VEP - 9)
  • AG low - 11
    AG med - 11
    AG high - 12
  • 64 - 31 (VEP - 22)
    128 - 36
    256 - 48

  • AG low - 39
    AG med - 39
    AG high - 51
  • 64 - 60 (VEP - 38)
    128 - 78 (VEP - 54)
    256 - 96 (VEP - 72)

  • AG low - 95
    AG med - 103
    AG high - 115
  • 64 - 17 (VEP - 16)
    128 - 22 (VEP - 22)
    256 - 24 (VEP - 27)

  • AG low - 25
    AG med - 25
    AG high - 29
  • 64 - 2
    128 - 195
    256 - 197


Значит, что можно сказать? Переход с 4,3 ггц на 3 ггц сродни катастрофе. Падение производительности, на мой взгляд, драматичное)) А вот переход с 6-ти ядер по 4,3 ггц на 10-ть по 3 ггц в теории может дать до 80% прироста, но есть нюанс. Если нагружать более медленные ядра тяжелыми плагинами (как например стелс лимитер с максимальным оверсемплингом), то прирост будет скромнее, до 25 процентов или даже не будет вовсе. Например, если такой лимитер поставить на мастер шину, то он нагрузит собой только одно ядро, и в этой ситуации более медленные ядра останутся в проигрыше. А вот хорошо распараллеливающиеся инструменты, типа контакта или луша покажут очень хороший результат даже на более медленных ядрах. Для себя пока вижу переход на зион оправданным, учитывая то, что их можно использовать два в одной системе. А 20 ядер и 40 потоков это уже очень хорошо))) Если кто-то что-нибудь добавит полезное, то буду рад. Я мог что-то упустить по незнанию.

p.s. потом дополню эти результаты показателями реального зиона, посмотрим, насколько точно получилось предсказать пользу от дополнительных ядер.

p.p.s а вообще, если ещё лучше подумать, то нужен двухпроцевый комп на зионах для вены со всеми синтами и библиотеками, и один комп с очень быстрым (свыше 4 ггц) современным процем, для управления веной и навешивания в daw всяких ништяков))
 
Последнее редактирование:
Купил 6-ую вену и решил проверить, правда ли, что она лучше 5-ой оптимизирована и даёт больше ресурсов.

  • 64 - 17 (VEP 5 - 16)
    128 - 21 (VEP 5 - 20)
    256 - 24 (VEP 5 - 24)

Как видим, никакого масштабного прироста в шестой вене не наблюдается.
 
Последнее редактирование:
@almazmusic, первое число - размер асиобуфера, второе - количество лушей в 6-ой вене, в скобках результат пятой вены для сравнения.
 
Последнее редактирование:
  • Like
Реакции: noshyn и Dmitry Anderson
@Dmitry Stepin, а без вены есть результаты? Какой она вообще дает прирост? Недавно общался с нашими кинокомпозиторами. Ни у кого вены нет. Вернее не хотят ставить по разным причинам.
 
@Alexlub, ну в первом посте же всё есть))

Я снова перешёл на работу с веной из-за того, что в тяжелых оркестровых проектах с кучей контактов кубейс почему-то начинает затыкаться, хотя его асио-метр показывает ещё достаточный запас. Вена в той же ситуации работает без проблем, поэтому я перестал экспериментировать с этим и просто все контакты гружу в вену. Надо учесть, что я для каждого инструмента или штриха использую отдельный контакт, то есть если в проекте задействовано сто инструментов, то они будут загружены в сто контактов))

До появления в кубейсе асиогарда вена давала колоссальный прирост, с появлением асиогарда всё изменилось коренным образом, но вот почему-то в случае с контактами вена всё-равно работает ровнее.
 
@almazmusic, одна из причин которую озвучивали это неудобство.
В кубейсе можно загружать большой темплейт без самих семплов контакта. Нажимаешь на нужный инструмент и мигом подгружаются сами семплы.
Я сам ничего не могу сказать так никогда веной не пользовался.
 
@Alexlub, вы очень ошибаетесь. Прям диаметрально. Но это не для этой темы вопросы. Вена как раз для удобства и для темплейтов и для параллели. Кубейс от 800 дорог с инструментами сдохнет, а вена всё разрулит.
Но ещё раз - есть спец тема по вене, можете там почитать и понять насколько неправы и вы и ваши "композиторы".
п.с. Кстати, а зачем вообще "композиторам" вена то? Вена для аранжей ведь.
 
@Aleksandr Oleynik, нет ещё. В любом случае сначала я поставлю один зион в свою сегодняшнюю мать вместо 4930к, после чего куплю двух сокетную плату со вторым зионом. Весь этот процесс апгрейда займёт какое-то, не очень короткое время. По мере выполнения этого плана)) я буду добавлять в тему результаты теста для сравнения.
 
Добавьте пожалуйста в тест такой кейс: например 8 импульсников подряд на моно треке
 
@basЫl, каких-то конкретных импульсников или любой подойдёт? И вообще, что этим будем проверять? И чем этот кейс отличается, например, от стелс лимитера с оверсемплингом на том же одном канале?

Но вот что точно нужно добавить в тест, так это какой-нибудь синтюк без поддержки многоядерности. Спайр или мэссив наверное попробую, или даже тот же lush с выключенным мультипроцессингом. Сразу я не подумал о том, что большинство плагинов как раз не поддерживают многопоточность, и именно все эти плагины и получают самый большой профит от высокой частоты..
 
Последнее редактирование:
ну в первом посте же всё есть))
Извини. Не понял что такое AG?
И что получается что с Asio Guard больше тянет?

вы очень ошибаетесь.
Это не мои слова. Люди наверняка работают с большими проектами и обходятся без вены.
Тоже вот один кинокомпозитор из США в лоджике с большим темплейтом и тоже без вены.


но вот почему-то в случае с контактами вена всё-равно работает ровнее.
Прям сильная разница?
 
Это не мои слова. Люди наверняка работают с большими проектами и обходятся без вены.
Тоже вот один кинокомпозитор из США в лоджике с большим темплейтом и тоже без вены.
https://www.vsl.co.at/en/News/Artists
Danny Elfman
Alexandre Desplat
Kevin Kliesch
Joe Kraemer
Daniel Licht
Blake Neely
David Newman

и это как минимум
 
Прям сильная разница?

Когда кубейс начинает заикаться и трещать, вена продолжает играть ровно. Большая ли это разница или нет? Я посчитал, что разница критичная.

И что получается что с Asio Guard больше тянет?

Да, в случае с lush кубейс тянет больше его копий, чем вена. Чем это может быть обусловлено даже не представляю. Может быть нужно поколдовать с различными комбинациями настроек многоядерности в вене. У меня же всегда включены все ядра для всех инстанций.

но есть которые не работают) перечислять не буду.

Это скорее зависит от количества треков в проекте. Посмотри на темплейт Junkie XL например. Там без вены вообще никак, просто из-за объема и количества инструментов. А если обойтись каким-то одним оркестром, спитфайр там или берлин, и при этом выключать не задействованные треки, то теоретически можно справиться без вены. Но в то же время нужно помнить, что некоторые контактовские библиотеки глючные и отжирают очень много ЦП (спитфайр этим особенно больны).
 
Последнее редактирование:
каких-то конкретных импульсников или любой подойдёт? И вообще, что этим будем проверять? И чем этот кейс отличается, например, от стелс лимитера с оверсемплингом на том же одном канале?
любой. проверяется мощь одного ядра, работающего последовательно.
хз, возможно что и ничем.
 
@vitalker, можно конкретнее?


Попробовал прогнать lush-101 с выключенным мультипроцессорингом в вене, это позволило немного улучшить результат вены, она почти догнала кубейс с асиогардом и без него по количеству копий луша, но всё-равно чуть меньше (но оно и понятно, у асиогарда просто больше буфер) -
  • 64 - 19 (17)*
  • 128 - 22 (21)*
  • 256 - 26 (24)*
*В скобках количество венских lush с включенным мультипроцессингом.

Вообще, в случае с веной нужно каждый плагин проверять на предмет того, работает ли он лучше с мультипроцессингом или без него. Например, контакт в вене лучше работает со своим мультипроцессингом, а lush-101, как мы видим, лучше работает без него.
 
Последнее редактирование:
некоторые контактовские библиотеки глючные и отжирают очень много ЦП (спитфайр этим особенно больны)
... я думаю, коллега имел в виду Берлины. Потому что Спитфайр, в особенности второе поколение оркестра, довольно нежруч. У меня на единственном венском сервере, помимо полного спитфайра (Chamber+Symph Strings, Brass и Woodwinds), еще столько всего разного в темплейты подвешено!..
скрин оркPC1.png
 
  • Like
Реакции: alex vladimiroff
Ну что, продолжим нашу беседу))) Рядом с каждой строкой я напишу разницу в процентах с результатами i7-4930k. Итак, результаты бенчей на xeon e5-2690 v2 (10 ядер, частота 3.3 гГц):

  • 64 - 2 (1C\1T) -50% 21 (10C\20T) -12%
    128 - 2 (1C\1T) -60% 23 (10C\20T) -4%
    256 - 3 (1C\1T) -40% 28 (10C\20T) +16%

  • AG low - 3 (1C\1T) -40% 31 (10C\20T) +29%
    AG med - 3 (1C\1T) -40% 31 (10C\20T) +24%
    AG high - 3 (1C\1T) -40% 32 (10C\20T) +23%
  • 32 - 20
  • 64 - 25 +31%
    128 - 30 +30%
    256 - 35 +40%

  • AG low - 37 +32%
    AG med - 39 +39%
    AG high - 43 +48%
  • 64 - 42 +35%
    128 - 38 +5%
    256 - 35 -27%

  • AG low - 36 -8%
    AG med - 35 -11%
    AG high - --
  • 64 - 83 +38%
    128 - 90 +15%
    256 - 101 +5%

  • AG low - 61 -35%
    AG med - 61 -40%
    AG high - --
  • 64 - 20 +17%
    128 - 20 -10%
    256 - 21 -12%

  • AG low - 19 -24%
    AG med - --
    AG high - --
  • 64 - 304 +57%
    128 - 314 +61%

Что ж, первые результаты оказались довольно интересными. Давайте теперь включим второй xeon и потестим два процессора:

  • 32 - 2 (1С\1Т) 19 (20С\40Т)
  • 64 - 2 (1C\1T) -50% 24 (20C\40T) 0%
    128 - 2 (1C\1T) -60% 26 (20C\40T) +8%
    256 - 3 (1C\1T) -40% 27 (20C\40T) +12%

  • AG low - 3 (1C\1T) -40% 24 (10C\20T) 0%
    AG med - 3 (1C\1T) -40% 25 (10C\20T) 0%
    AG high - 3 (1C\1T) -40% 25 (10C\20T) -4%
  • 32 - 31
  • 64 - 32 +68%
    128 - 33 +43%
    256 - 35 +40%

  • AG low - 37 +32%
    AG med - 39 +39%
    AG high - 43 +48%
  • 64 - 64 +106%
    128 - 57 +58%
    256 - 44 -8%

  • AG low - 36 -8%
    AG med - 35 -11%
    AG high - --
  • 32 - 99
  • 64 - 129 +115%
    128 - 118 +51%
    256 - 123 +28%

  • AG low - 61 -35%
    AG med - 61 -40%
    AG high - --
  • 32 - 18
  • 64 - 22 +29%
    128 - 24 +9%
    256 - 24 0%

  • AG low - 13 -48%
    AG med - 11 -56%
    AG high - 21 -27%
Spire
  • 64 +52%
    128 +50%
    256 +25%
Sylenth 1
  • 32 +33%
  • 64 +55%
  • 128 +31%
  • 256 +21%
Lush-101
  • 32 +55%
  • 64 +45%
  • 128 +27%
  • 256 -10%
Stealth Limiter
  • 32 -5%
  • 64 +14%
  • 128 +13%
  • 256 -3%
Avenger
  • 32 0%
  • 64 +10%
  • 128 +20%
  • 256 +14%



В ходе тестирования стало понятно, что сравнение не получается корректным. Оказалось, что почти все плагины, которые я выбрал для сравнения некорректно работают на 40 потоках. С чем связано такое их поведение я не знаю =((( Но выражается это в том, что плагин при увеличении задержки позволяет включать меньше своих инстанций. И если без асиогарда это ярко выражено у спайра, то с асиогардом глючат почти все. Я смотрел загрузку ядер и выяснилось, что глючащие плагины без асиогарда используют только 32 потока, а с асиогардом начинают нагружать все ядра, но перестают звучать. Также такой момент происходит - добавляем 50 инстанций спайра и загрузка АСИО стоит на 50 процентах, включаем 51-й спайр и загрузка резко улетает в сто процентов и всё трещит. Такая же история с авенгером. С веной тоже самое происходит, она явно сильнее грузит процессоры, чем кубейс. Поэтому с ней нужно разбираться, можно ли что-то с этим сделать. 5-ый плей тоже глючит - мой тестовый проект с 35-ю тяжелыми легатными патчами Голливуд Стрингз больше не играет, загрузка АСИО крутится вокруг 10-15 процентов, но звук трещит. На 4930k с большей загрузкой АСИО играло без проблем. Зато на 32-х и 64-х семплах почти все синты показали отличный прирост. Жаль, что все плагины так не смогли)) Пока выводы такие - вообще не понятно, что происходит. Корректные ли результаты или нет. Буду дальше изучать ситуацию, если что-то интересное нарою, то буду сюда писать.
[DOUBLEPOST=1514662612][/DOUBLEPOST]Почему-то пробелы автоматом убираются и строчки съезжают(( Немного неудобно получается читать результаты((
 
Последнее редактирование:
  • Like
Реакции: MoVoX
Чудеса продолжаются.. Отключил гипертрединг.)) В процентах разница с включенным гипертредингом.

  • 32 - 2 (1С\1Т) 17 (20С\20Т) -10%
  • 64 - 2 (1C\1T) 20 (20C\20T) -16%
    128 - 2 (1C\1T) 22 (20C\20T) -15%
    256 - 3 (1C\1T) 24 (20C\20T) -11%

  • AG low - 3 (1C\1T) 24 (20C\20T) 0%
    AG med - 3 (1C\1T) 26 (20C\20T) +4%
    AG high - 3 (1C\1T) 27 (20C\20T) +8%
  • 32 - 24 -22%
  • 64 - 39 +22%
    128 - 40 +22%
    256 - 41 +17%

  • AG low - 40 +8%
    AG med - 40 +2%
    AG high - 40 -7%
  • 32 - 66
  • 64 - 70 +10%
    128 - 62 +9%
    256 - 49 +11%

  • AG low - 48 +33%
    AG med - 39 +11%
    AG high - 38
  • 32 - 116 +17%
  • 64 - 128 -1%
    128 - 117 -1%
    256 - 117 -4%

  • AG low - 90 +47%
    AG med - 90 +47%
    AG high - 151
  • 32 - 20 +11%
  • 64 - 21 -4%
    128 - 23 -4%
    256 - 23 -4%

  • AG low - 11 -15%
    AG med - 12 +11%
    AG high - 29 +38%
  • 32 - 320

Удивительные вещи. Особенно удивил ДАВбенч, который на 32-х семлах все 40 треков с reaxcomp стал воспроизводить.. Вейвсам аццки полегчало от отключенного гипертрейдинга. И в основном всё только улучшилось с остальными плагинами. Eastwest Play глючит с асиогардом. Если я включаю асиобуфер в 20 мс, то тот тяжелый проект играет нормально. А если я включу асиогард с задержкой 20 мс, то нифига не играет. То ли асиогард глючит сам по себе, то ли плагины что-то мутят с ним.
[DOUBLEPOST=1514679491][/DOUBLEPOST]
А теперь пропустите синты через jbridge

Да ну его в пень. У меня ещё опыты с веной впереди.




UPD от 21.11.2018 - тут обновление некоторых результатов - https://rmmedia.ru/threads/128206/page-4#post-2299233
 
Последнее редактирование:
  • Like
Реакции: MoVoX
Eastwest Play глючит с асиогардом.

Глючит, собака. Если включить только 12 ядер, то работает плей просто изумительно. Как только начинаешь включать больше 12-ти ядер, то эта собака начинает трещать и запинаться.
[DOUBLEPOST=1515015719][/DOUBLEPOST]В общем, я тут ковырялся в совершенно разных вариантах сочетаний количества ядер, гипертрединга, асио буферов и асиогардов. В итоге вывод такой - если у вашего процессора более 12-ти ядер, то нормальная работа всей этой вст чухни не гарантируется. Скорее всего плагины начнут глючить и удивлять неадекватным поведением. И ещё - после 12-ти ядер реальный прирост асиоперфоманса в проектах практически не заметен. В чём выражается? Очень просто. Нагрузка на ЦП по диспетчеру задач снижается, а в ДАВ асиометр стоит на тех же позициях. В некоторых проектах небольшой прирост заметен, в некоторых нет. Зависит от используемых плагинов. И вена превратилась в костыль с этой двухпроцессорной конфигурацией. Кубейс тянет тупо больше инстанций, чем она. Возможно, что частично за такое поведение ответственна 10-ка, но у меня уже нет желания проверять всё то же самое на 7-ке. Общий итог всего этого таков, что мой бывший разогнанный 4930к, что этот двухпроцевый монстр в реальных проектах показывают практически идентичную производительность по асиометру. Единственное, что стало хуже, так это вена. Но тут уж я не знаю в чём дело, обычно вена всегда была впереди. Ну и глючащие плагины с асиогардом сахара не добавляют:D В общем, куча ядер пока не есть хорошо.


p.s. купил 6-ой плей. Он чуть лучше работает, реже спотыкается. И грузит патчи быстрее. Но всё-равно не идеал.
 
Последнее редактирование:
  • Like
Реакции: 02_Goliaf
А так, по сравнительным бенчам двухпроц сильно впереди. Вот только к реальной работе это весьма косвенно относится. Хорошо, что мне связка мать+два зиона достались по дешевке. Если бы я только на новые зионы потратил 240 тыщ, то я бы сейчас был злой:D
[DOUBLEPOST=1515016212][/DOUBLEPOST]Да, речь идёт исключительно о кубейсе. Возможно, что в других ДАВ ситуация была бы иной.
 
  • Like
Реакции: 02_Goliaf и Vosk

Сейчас просматривают