algorithmica-org · sslotin · Mar 18, 2020 · Jan 6, 2020
diff --git a/sse.md b/sse.md
@@ -39,7 +39,7 @@ int main() {
 
 Раньше, во времена, когда компьютеры назывались ЭВМ-ами и занимали целую комнату, увеличение производительности происходило в основном за счёт увеличения тактовой частоты. Тактовая частота условно равна количеству инструкций, выполняемому процессором за единицу времени. (На современных процессорах [это не так](http://ithare.com/infographics-operation-costs-in-cpu-clock-cycles/) — разные инструкции занимают разное время, которое ещё и может зависеть от разных обстоятельств.)
 
-Помимо жесткого [физического ограничения](https://ru.wikipedia.org/wiki/%D0%A1%D0%BA%D0%BE%D1%80%D0%BE%D1%81%D1%82%D1%8C_%D1%81%D0%B2%D0%B5%D1%82%D0%B0) на максимально возможную тактовую частоту, такой подход в какой-то момент просто перестал быть экономически оправданным: прямое увеличение тактовой частоты приводит к в более чем линейному потреблению энергии, и, следовательно, выделению тепла, которое к тому же нужно ещё как-то выводить.
+Помимо жесткого [физического ограничения](https://ru.wikipedia.org/wiki/%D0%A1%D0%BA%D0%BE%D1%80%D0%BE%D1%81%D1%82%D1%8C_%D1%81%D0%B2%D0%B5%D1%82%D0%B0) на максимально возможную тактовую частоту, такой подход в какой-то момент просто перестал быть экономически оправданным: прямое увеличение тактовой частоты приводит к более чем линейному потреблению энергии, и, следовательно, выделению тепла, которое к тому же нужно ещё как-то выводить.
 
 Поэтому вендоры, в погоне за более дешёвым [флопсом](https://en.wikipedia.org/wiki/FLOPS) за доллар, пошли по другому пути: стали добавлять более сложные инструкции, которые делают сразу много полезных действий за раз. Но есть и недостаток: микросхема от добавления новых инструкций сильно усложняется, что может стать критичным во многих других применениях. В связи с этим, все архитектуры стали делиться на два типа:
 
@@ -77,7 +77,7 @@ SSE — это обобщённое название всех SIMD-инстру
 
 ![](https://i0.wp.com/www.urtech.ca/wp-content/uploads/2017/11/Intel-mmx-sse-sse2-avx-AVX-512.png)
 
-Поддержка SIMD-инструкций добавлялись постепенно, сохраняя обратную совместимость. Если третий пентиум в 1999-м году умел работать с регистрами размера 128, то в самых современных i7 есть 512-битные регистры. Автор не является специалистом в проектировании микропроцессоров, но предполагает, то регистры больше 64 байт (512 бит) появятся не скоро, потому что это уже больше размера [кэш-линии](https://en.wikipedia.org/wiki/CPU_cache)
+Поддержка SIMD-инструкций добавлялись постепенно, сохраняя обратную совместимость. Если третий пентиум в 1999-м году умел работать с регистрами размера 128, то в самых современных i7 есть 512-битные регистры. Автор не является специалистом в проектировании микропроцессоров, но предполагает, что регистры больше 64 байт (512 бит) появятся не скоро, потому что это уже больше размера [кэш-линии](https://en.wikipedia.org/wiki/CPU_cache)
 
 Чтобы разработчикам не нужно было предоставлять отдельные оптимизированные бинарники под каждую конкретную архитектуру, информация о поддержке наборов инструкций процессором зашита в ассемблерную инструкцию `cpuid`, которую можно просто вызвать в рантайме и всё узнать: [например так](https://gist.github.com/hi2p-perim/7855506).
 
@@ -440,7 +440,7 @@ void simple_fenwick() {
 void vectorized_fenwick() {
     memcpy(rs, q, sizeof q);
 
-    // то же самые циклы фенвика, только вдоль запросов;
+    // те же самые циклы фенвика, только вдоль запросов;
     // вместо остановки по условию, цикл исполняется logn раз,
     // из которых сколько-то последних итераций ничего не изменят
     for (int l = 0; l < logn; l++) {