Cоздана реализация метода частиц без синхронизации при пересылке модельных частиц из одной ячейки в другую путем реализации нескольких буферов обмена (по числу направлений) для каждой ячейки (рисунок 1) и суммирования значений тока параллельными потоками, связанными с узлами сетки. Достигнут уровень производительности 0.5 TFLOPS, что превосходит аналогичные показатели для современных многоядерных процессоров более чем в два раза. Впервые создана возможность проведения полностью трехмерных вычислительных экспериментов по моделированию плазменной турбулентности.