並行編程 - 數據並行 System.Threading.Tasks.Parallel 類(.NET)

原文轉載於:https://www.cnblogs.com/springsnow/p/9405016.html

目錄

 


回到頂部

一、並行概念

1、並行編程

      在.NET 4中的並行編程是依賴Task Parallel Library(後面簡稱爲TPL) 實現的。在TPL中,最基本的執行單元是task(中文可以理解爲"任務"),一個task就代表了你要執行的一個操作。你可以爲你所要執行的每一個操作定義一個task,TPL就負責創建線程來執行你所定義的task,並且管理線程。TPL是面向task的,自動的;而傳統的多線程是以人工爲導向的。

現在已經進入了多核的時代,我們的程序如何更多的利用好硬件cpu,答案是並行處理。在.net4.0之前我們要開發並行的程序是非常的困難,在.net4.0中,在命名空間System.Threading.Tasks提供了方便的並行開發的類庫。

2、數據並行

      數據並行指的是對源集合或數組的元素同時(即,並行)執行相同操作的場景。 在數據並行操作中,對源集合進行分區,以便多個線程能夠同時在不同的網段上操作。

      任務並行庫 (TPL) 支持通過 System.Threading.Tasks.Parallel 類實現的數據並行。 此類對 for 循環和 foreach 循環提供了基於方法的並行執行。你爲Parallel.For 或 Parallel.ForEach 循環編寫的循環邏輯與編寫連續循環的相似。 無需創建線程或列工作項。 在基本循環中,不需要加鎖。TPL 爲你處理所有低級別的工作。

      Parallel.For()和Parallel.ForEach()方法多次調用同一個方法,而Parallel.Invoke()方法允許同時調用不同的方法。

回到頂部

二、Parallel.Invoke():並行調用多個任務 。

例1:同時調用2個任務

static void Main(string[] args)
{
var watch = Stopwatch.StartNew();
Parallel.Invoke(Run1, Run2);
watch.Stop();
Console.WriteLine("我是並行開發,總共耗時:{0}", watch.ElapsedMilliseconds)
}

static void Run1()
{
Console.WriteLine("我是任務一,我跑了3s");
Thread.Sleep(3000);
}

static void Run2()
{
Console.WriteLine("我是任務二,我跑了5s");
Thread.Sleep(5000);
}

例2:說明並不是每個任務一個線程。

// 定義一個線程局部變量,返回其線程名
ThreadLocal<string> ThreadName = new ThreadLocal<string>(() =>
{
return "Thread" + Thread.CurrentThread.ManagedThreadId;
});

// 打印出當前線程名的方法。
Action action = () =>
{
// 如果 ThreadName.IsValueCreated 爲true,在這個線程上不是第一次運行這個方法。
bool repeat = ThreadName.IsValueCreated;
Console.WriteLine("ThreadName = {0} {1}", ThreadName.Value, repeat ? "(repeat)" : "");
};

// 調用8個方法,你應該會看到一些重複的線程名
Parallel.Invoke(action, action, action, action, action, action, action, action);
ThreadName.Dispose();

 

image

回到頂部

三、Parallel.For(): for 循環的並行運算 

      我們知道串行代碼中也有一個for,但是那個for並沒有用到多核,而Paraller.for它會在底層根據硬件線程的運行狀況來充分的使用所有的可利用的硬件線程,注意這裏的Parallel.for的步行是1。

      在For()方法中,前兩個參數定義了循環的開頭和結束。示例從0迭代到9。第3個參數是一個 Action<int>委託。整數參數是循環的迭代次數,該參數被傳遞給Action < int >委託引用的方法。 Parallel.For方法的返回類型是ParallelLoopResult結構,它提供了循環是否結束的信息。

ParallelLoopResult result = Parallel.For(0, 10, i =>
{
Console.WriteLine("{0}, task: {1}, thread: {2}", i, Task.CurrentId, Thread.CurrentThread.ManagedThreadId);
Thread.Sleep(10);
});
Console.WriteLine(result.IsCompleted);

首先先寫一個普通的循環:

private void NormalFor()
{
for (var i = 0; i < 10000; i++)
{
for (var j = 0; j < 1000; j++)
{
for (var k = 0; k < 100; k++)
{
DoSomething();
}
}
}
}

再看一個並行的For語句:

private void ParallelFor()
{
Parallel.For(0, 10000, i =>
{
for (int j = 0; j < 1000; j++)
{
for (var k = 0; k < 100; k++)
{
DoSomething();
}
}

});
}

上面的例子中,只是將最外層的For語句替換成了Parallel.For,Parallel執行速度可以提高近一倍。

回到頂部

四、Parallel.ForEach():foreach 循環的並行運算 

private void NormalForeach()
{
foreach (var file in GetFiles())
{
DoSomething();
}

}

private void ParallelForeach()
{
Parallel.ForEach(GetFiles(), file => {
DoSomething();
});
}

ForEach的使用跟For使用幾乎是差不多了,只是在對非泛型的Collection進行操作的時候,需要通過Cast方法進行轉換。

ForEach的獨到之處就是可以將數據進行分區,每一個小區內實現串行計算,分區採用Partitioner.Create實現。

for (int j = 1; j < 4; j++)
{
Console.WriteLine("\n第{0}次比較", j);
ConcurrentBag<int> bag = new ConcurrentBag<int>();
var watch = Stopwatch.StartNew();
watch.Start();
for (int i = 0; i < 3000000; i++)
{
bag.Add(i);
}
Console.WriteLine("串行計算:集合有:{0},總共耗時:{1}", bag.Count, watch.ElapsedMilliseconds);

GC.Collect();
bag = new ConcurrentBag<int>();
watch = Stopwatch.StartNew();
watch.Start();
Parallel.ForEach(Partitioner.Create(0, 3000000), i =>
{
for (int m = i.Item1; m < i.Item2; m++)
{
bag.Add(m);
}
});
Console.WriteLine("並行計算:集合有:{0},總共耗時:{1}", bag.Count, watch.ElapsedMilliseconds);
GC.Collect();
}

回到頂部

五、線程局部變量

下面這段代碼多次運行每次的結果都不一樣,因爲total變量是公共的,而我們的程序是多個線程的加,而多個線程之間是不能把數據共享的。

public void NormalParallelTest()
{
int[] nums = Enumerable.Range(0, 1000000).ToArray();
long total = 0;
Parallel.For(0,nums.Length,i=>
{
total += nums[i];
});
Console.WriteLine("The total is {0}", total);
}

其實我們需要的是在每個線程中計算出一個和值,然後再進行累加。我們來看看線程局部變量:

泛型方法Parallel.For<T>的原型:

public static ParallelLoopResult For<TLocal>
(int fromInclusive, int toExclusive, 
 Func<TLocal> localInit, 
 Func<int, ParallelLoopState, TLocal, TLocal> body,
 Action<TLocal> localFinally);
  • TLocal:線程變量的類型;第一個、第二個參數就不必多說了,就是起始值跟結束值。
  • localInit:每個線程的線程局部變量初始值的設置;
  • body:每次循環執行的方法,其中方法的最後一個參數就是線程局部變量;
  • localFinally:每個線程之後執行的方法。

1、Parallel.For中定義局部變量:

從2開始,累加2個,得49.

int[] nums = Enumerable.Range(0, 10).ToArray();
long total = 0;

Parallel.For<long>(0, nums.Length, () => { return 2; },

(j, loop, subtotal) =>//1、每次循環執行的方法
{
subtotal += nums[j];
Console.WriteLine("主體: thread {1}, task {2},結果:{0}", j+ ":" +nums[j] + "-" + subtotal, Thread.CurrentThread.ManagedThreadId, Task.CurrentId);

return subtotal;
},

(x) =>//2、每個線程執行之後執行的方法
{

Console.WriteLine(" 最終執行:thread {1}, task {2},結果:{0} ", x, Thread.CurrentThread.ManagedThreadId, Task.CurrentId);
Interlocked.Add(ref total, x);
});
Console.WriteLine("The total is {0}", total);

image

2、Parallel.Each中定義局部變量:

要注意的是,我們必須要使用ForEach<TSource, TLocal>,因爲第一個參數表示的是迭代源的類型,第二個表示的是線程局部變量的類型,其方法的參數跟For是差不多的。

public void ForeachThreadLocalTest()
{
    int[] nums = Enumerable.Range(0, 1000000).ToArray();
    long total = 0;
    Parallel.ForEach<int,long>(nums,()=>0,


 

        (member,loopState,subTotal)=>//1、每次循環執行的方法
        {
            subTotal += member;
            return subTotal;
        },


        (perLocal)=>//2、每個線程執行之後執行的方法

           Interlocked.Add(ref total,perLocal)
       );
    Console.WriteLine("The total is {0}", total);
}

回到頂部

六、Break、Stop中斷與停止線程

      在並行循環的委託參數中提供了一個ParallelLoopState,該實例提供了Break和Stop方法來幫我們實現。

  • Break“中斷”:表示完成當前線程上當前迭代之前的所有線程上的所有迭代,然後退出循環。(比如並行計算正在迭代100,那麼break後程序還會迭代所有小於100的。)
  • Stop“停止”:表示在方便的情況下儘快停止所有迭代。(比如正在迭代100突然遇到stop,那它啥也不管了,直接退出。)

首先我們可以看到在Parallel.For的一個重載方法:

public static ParallelLoopResult For(int fromInclusive, int toExclusive, Action<int, ParallelLoopState > body)

在委託的最後一個參數類型爲ParallelLoopState,而ParallelLoopState裏面提供給我們兩個方法:Break、Stop來終止迭代。

private void StopLoop()
{
    var Stack = new ConcurrentStack<string>();
    Parallel.For(0, 10000, (i, loopState

) =>
    {
        if (i < 1000)
            Stack.Push(i.ToString());
        else
        {
            loopState.Stop();
            return;
        }
    });
    Console.WriteLine("Stop Loop Info:\n elements count:{0}", Stack.Count);    
}

 

回到頂部

七、Cancel取消循環

      在並行的循環中支持通過傳遞ParallelOptions參數中的CancellationToken進行取消循環的控制,我們可以CancellationTokenSource實例化之後傳遞給ParallelOptions對象Cancellation值。下面來看個示例:

      在For循環的實現代碼內部,Parallel類驗證CancellationToken 的結果,並取消操作。一旦取消操作,For()方法就拋出個OperationCanceledException類型的異常,這是本例捕獲的異常。使用 CancellationTokeri可以註冊取消操作時的信息。爲此,需要調用Register方法,並傳遞一個在取消 操作時調用的委託。

var cts = new CancellationTokenSource();
cts.Token.Register(() =>Console.WriteLine("*** token canceled"));

// start a task that sends a cancel after 500 ms
new Task(() =>
{
Thread.Sleep(500);
cts.Cancel(false);
}).Start();

try
{
ParallelLoopResult result =
Parallel.For(0, 100,
new ParallelOptions()
{
CancellationToken = cts.Token,
},
x =>
{
Console.WriteLine("loop {0} started", x);
int sum = 0;
for (int i = 0; i < 100; i++)
{
Thread.Sleep(2);
sum += i;
}
Console.WriteLine("loop {0} finished", x);
});
}
catch (OperationCanceledException ex)
{
Console.WriteLine(ex.Message);
}

回到頂部

八、Handel Exceptions異常處理

      在處理並行循環的異常的與順序循環異常的處理是有所不同的,並行循環裏面可能會一個異常在多個循環中出現,或則一個線程上的異常導致另外一個線程上也出現異常。比較好的處理方式就是,首先獲取所有的異常最後通過AggregateException來包裝所有的循環的異常,循環結束後進行throw。看一段示例代碼:

private void HandleNumbers(int[] numbers)
{
    var exceptions = new ConcurrentQueue<Exception>();
    Parallel.For(0, numbers.Length, i => 
    {
        try
        {
            if (numbers[i] > 10 && numbers[i] < 20)
            {
                throw new Exception(String.Format("numbers[{0}] betwewn 10 to 20",i));
            }
        }
        catch (Exception e)
        {
            exceptions.Enqueue(e);
        }
    });
   

       if (exceptions.Count > 0) throw new AggregateException(exceptions); }

測試方法:

public void HandleExceptions()
{
var numbers = Enumerable.Range(0, 10000).ToArray();
try
{
this.HandleNumbers(numbers);
}
catch(AggregateException exceptions)
{
foreach (var ex in exceptions.InnerExceptions)
{
Console.WriteLine(ex.Message);
}
}
}

對上面的方法說明下,在HandleNumbers方法中,就是一個小的demo如果元素的值出現在10-20之間就拋出異常。在上面我們的處理方法就是:在循環時通過隊列將所有的異常都集中起來,循環結束後來拋出一個AggregateException。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章