Симуляция программы MATLAB с учетом требований к процессору

matlab processor execution-time

81 просмотра

2 ответа

У меня есть система с конфигурацией Intel® Core (TM) i3-5020U CPU @ 2,2 ГГц, 4 ГБ оперативной памяти. Но чтобы сравнить производительность моей программы MATLAB с точки зрения времени выполнения, мне нужно выполнить ее на машине с конфигурацией Intel® R (Core) i5-3570 CPU @ 3,40 ГГц, 16 ГБ ОЗУ. Есть ли способ выполнить этот вид симуляции?

Автор: sai Источник Размещён: 08.11.2019 10:58

Ответы (2)


1 плюс

TL: DR: нет . Различия в производительности между Broadwell и IvyBridge зависят от множества сложных деталей. (См . Микроархитектору Agner Fog pdf для получения сведений о микроархитектуре низкого уровня , а также другие материалы в вики-теге )

Вероятно, что производительность будет зависеть от тактовой частоты или скорости памяти в пределах, возможно, 10%, даже между различными микроархитектурами, но это не так.

Используя свою собственную систему, вы, вероятно, сможете выяснить, как ваш код масштабируется с частотой процессора, заставляя его оставаться на минимальной частоте для выполнения теста. Если это намного меньше, чем идеальное масштабирование, то скорость памяти является важным фактором. (Чем медленнее ваш процессор, тем меньше циклов тратится на ожидание памяти.)


Вы не можете экстраполировать производительность IvB i5 3,4 ГГц от производительности BDW 2,2 ГГц, не зная гораздо больше подробностей о том, в чем именно узкие места вашего кода. Вполне возможно, что это узкие места на одной и той же простой вещи на обоих процессорах, и в этом случае вы можете экстраполировать. например, если окажется, что это узкие места на FP, умножьте задержку, то время выполнения на IvB будет в 5/3 раза больше времени работы на Broadwell (умноженное на тактовую частоту), так как BDW имеет 3 цикла FP, умноженные и сложенные, но SnB / IvB / Haswell имеют 5-кратное умножение. (FMA - это 5 циклов в BDW, если я правильно помню. IvB не поддерживает FMA, поэтому, если Matlab использует это в BDW, он даже не запускает тот же машинный код).

Скорее всего, это не так просто, и производительность кеша / памяти также влияет на это. У Haswell / Broadwell нет конфликтов кеш-банка L1, но есть у SnB / IvB.

В зависимости от того, как вы выполняете рабочую нагрузку на процессор i5, он может или не сможет работать на частоте выше, чем его номинальная 3,4 ГГц, что еще больше затрудняет любые попытки угадать производительность.

Автор: Peter Cordes Размещён: 20.08.2016 06:54

0 плюса

На разных компьютерах сложно определить практическую эффективность. Вот почему вы обычно используете теоретическую эффективность с Big-O , проверьте страницу вики на предмет эффективности алгоритма и обозначений Big-O .

В случае, если у вас есть доступ к обоим кодам (ваш и код другого парня), вы можете проверить их на одном компьютере с помощью методов измерения производительности, предложенных mathworks, которые в основном представляют собой функции времени в реальном времени и времени процессора.

Наконец, вы можете увидеть здесь несколько проблем с тестированием производительности, которые могут быть интересны для рассмотрения.

Автор: silgon Размещён: 20.08.2016 07:01
Вопросы из категории :
32x32