Java遍歷集合方法分析(實現(xiàn)原理、算法性能、適用場合)

字號：小 中 大

    這篇文章主要介紹了Java遍歷集合方法分析（實現(xiàn)原理、算法性能、適用場合）的相關(guān)資料,需要的朋友可以參考下
    概述
    Java語言中，提供了一套數(shù)據(jù)集合框架，其中定義了一些諸如List、Set等抽象數(shù)據(jù)類型，每個抽象數(shù)據(jù)類型的各個具體實現(xiàn)，底層又采用了不同的實現(xiàn)方式，比如ArrayList和LinkedList。
    除此之外，Java對于數(shù)據(jù)集合的遍歷，也提供了幾種不同的方式。開發(fā)人員必須要清楚的明白每一種遍歷方式的特點、適用場合、以及在不同底層實現(xiàn)上的表現(xiàn)。下面就詳細分析一下這一塊內(nèi)容。
    數(shù)據(jù)元素是怎樣在內(nèi)存中存放的？
    數(shù)據(jù)元素在內(nèi)存中，主要有2種存儲方式：
    1、順序存儲，Random Access（Direct Access）：
    這種方式，相鄰的數(shù)據(jù)元素存放于相鄰的內(nèi)存地址中，整塊內(nèi)存地址是連續(xù)的。可以根據(jù)元素的位置直接計算出內(nèi)存地址，直接進行讀取。讀取一個特定位置元素的平均時間復雜度為O(1)。正常來說，只有基于數(shù)組實現(xiàn)的集合，才有這種特性。Java中以ArrayList為代表。
    2、鏈式存儲，Sequential Access：
    這種方式，每一個數(shù)據(jù)元素，在內(nèi)存中都不要求處于相鄰的位置，每個數(shù)據(jù)元素包含它下一個元素的內(nèi)存地址。不可以根據(jù)元素的位置直接計算出內(nèi)存地址，只能按順序讀取元素。讀取一個特定位置元素的平均時間復雜度為O(n)。主要以鏈表為代表。
    Java中以LinkedList為代表。
    Java中提供的遍歷方式有哪些？
    1、傳統(tǒng)的for循環(huán)遍歷，基于計數(shù)器的：
    遍歷者自己在集合外部維護一個計數(shù)器，然后依次讀取每一個位置的元素，當讀取到最后一個元素后，停止。主要就是需要按元素的位置來讀取元素。這也是最原始的集合遍歷方法。
    寫法為：
    for (int i = 0; i < list.size(); i++) {
    list.get(i);
    }
    2、迭代器遍歷，Iterator：
    Iterator本來是OO的一個設(shè)計模式，主要目的就是屏蔽不同數(shù)據(jù)集合的特點，統(tǒng)一遍歷集合的接口。Java作為一個OO語言，自然也在Collections中支持了Iterator模式。
    寫法為：
    Iterator iterator = list.iterator();
    while (iterator.hasNext()) {
    iterator.next();
    }
    3、foreach循環(huán)遍歷：
    屏蔽了顯式聲明的Iterator和計數(shù)器。
    優(yōu)點：代碼簡潔，不易出錯。
    缺點：只能做簡單的遍歷，不能在遍歷過程中操作（刪除、替換）數(shù)據(jù)集合。
    寫法為：
    for (ElementType element : list) {
    }
    每個遍歷方法的實現(xiàn)原理是什么？
    1、傳統(tǒng)的for循環(huán)遍歷，基于計數(shù)器的：
    遍歷者自己在集合外部維護一個計數(shù)器，然后依次讀取每一個位置的元素，當讀取到最后一個元素后，停止。主要就是需要按元素的位置來讀取元素。
    2、迭代器遍歷，Iterator：
    每一個具體實現(xiàn)的數(shù)據(jù)集合，一般都需要提供相應(yīng)的Iterator。相比于傳統(tǒng)for循環(huán)，Iterator取締了顯式的遍歷計數(shù)器。所以基于順序存儲集合的Iterator可以直接按位置訪問數(shù)據(jù)。而基于鏈式存儲集合的Iterator，正常的實現(xiàn)，都是需要保存當前遍歷的位置。然后根據(jù)當前位置來向前或者向后移動指針。
    3、foreach循環(huán)遍歷：
    根據(jù)反編譯的字節(jié)碼可以發(fā)現(xiàn)，foreach內(nèi)部也是采用了Iterator的方式實現(xiàn)，只不過Java編譯器幫我們生成了這些代碼。
    各遍歷方式對于不同的存儲方式，性能如何？
    1、傳統(tǒng)的for循環(huán)遍歷，基于計數(shù)器的：
    因為是基于元素的位置，按位置讀取。所以我們可以知道，對于順序存儲，因為讀取特定位置元素的平均時間復雜度是O(1)，所以遍歷整個集合的平均時間復雜度為O(n)。而對于鏈式存儲，因為讀取特定位置元素的平均時間復雜度是O(n)，所以遍歷整個集合的平均時間復雜度為O(n2)（n的平方）。
    ArrayList按位置讀取的代碼：直接按元素位置讀取。
    transient Object[] elementData;
    public E get(int index) {
    rangeCheck(index);
    return elementData(index);
    }
    E elementData(int index) {
    return (E) elementData[index];
    }
    LinkedList按位置讀取的代碼：每次都需要從第0個元素開始向后讀取。其實它內(nèi)部也做了小小的優(yōu)化。
    transient int size = 0;
    transient Node<E> first;
    transient Node<E> last;
    public E get(int index) {
    checkElementIndex(index);
    return node(index).item;
    }
    Node<E> node(int index) {
    if (index < (size >> 1)) { //查詢位置在鏈表前半部分，從鏈表頭開始查找
    Node<E> x = first;
    for (int i = 0; i < index; i++)
    x = x.next;
    return x;
    } else { //查詢位置在鏈表后半部分，從鏈表尾開始查找
    Node<E> x = last;
    for (int i = size - 1; i > index; i--)
    x = x.prev;
    return x;
    }
    }
    2、迭代器遍歷，Iterator：
    那么對于RandomAccess類型的集合來說，沒有太多意義，反而因為一些額外的操作，還會增加額外的運行時間。但是對于Sequential Access的集合來說，就有很重大的意義了，因為Iterator內(nèi)部維護了當前遍歷的位置，所以每次遍歷，讀取下一個位置并不需要從集合的第一個元素開始查找，只要把指針向后移一位就行了，這樣一來，遍歷整個集合的時間復雜度就降低為O(n)；
    （這里只用LinkedList做例子）LinkedList的迭代器，內(nèi)部實現(xiàn)，就是維護當前遍歷的位置，然后操作指針移動就可以了：
    代碼：
    public E next() {
    checkForComodification();
    if (!hasNext())
    throw new NoSuchElementException();
    lastReturned = next;
    next = next.next;
    nextIndex++;
    return lastReturned.item;
    }
    public E previous() {
    checkForComodification();
    if (!hasPrevious())
    throw new NoSuchElementException();
    lastReturned = next = (next == null) ? last : next.prev;
    nextIndex--;
    return lastReturned.item;
    }
    3、foreach循環(huán)遍歷：
    分析Java字節(jié)碼可知，foreach內(nèi)部實現(xiàn)原理，也是通過Iterator實現(xiàn)的，只不過這個Iterator是Java編譯器幫我們生成的，所以我們不需要再手動去編寫。但是因為每次都要做類型轉(zhuǎn)換檢查，所以花費的時間比Iterator略長。時間復雜度和Iterator一樣。
    使用Iterator的字節(jié)碼：
    Code:
    new # // class java/util/ArrayList
    dup
    invokespecial # // Method java/util/ArrayList."<init>":()V
    astore_
    aload_
    invokeinterface #, // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator;
    astore_
    goto
    aload_
    invokeinterface #, // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object;
    pop
    aload_
    invokeinterface #, // InterfaceMethod java/util/Iterator.hasNext:()Z
    ifne
    return
    使用foreach的字節(jié)碼：
    Code:
    new # // class java/util/ArrayList
    dup
    invokespecial # // Method java/util/ArrayList."<init>":()V
    astore_
    aload_
    invokeinterface #, // InterfaceMethod java/util/List.iterator:()Ljava/util/Iterator;
    astore_
    goto
    aload_
    invokeinterface #, // InterfaceMethod java/util/Iterator.next:()Ljava/lang/Object;
    checkcast # // class loop/Model
    astore_
    aload_
    invokeinterface #, // InterfaceMethod java/util/Iterator.hasNext:()Z
    ifne
    return
    各遍歷方式的適用于什么場合？
    1、傳統(tǒng)的for循環(huán)遍歷，基于計數(shù)器的：
    順序存儲：讀取性能比較高。適用于遍歷順序存儲集合。
    鏈式存儲：時間復雜度太大，不適用于遍歷鏈式存儲的集合。
    2、迭代器遍歷，Iterator：
    順序存儲：如果不是太在意時間，推薦選擇此方式，畢竟代碼更加簡潔，也防止了Off-By-One的問題。
    鏈式存儲：意義就重大了，平均時間復雜度降為O(n)，還是挺誘人的，所以推薦此種遍歷方式。
    3、foreach循環(huán)遍歷：
    foreach只是讓代碼更加簡潔了，但是他有一些缺點，就是遍歷過程中不能操作數(shù)據(jù)集合（刪除等），所以有些場合不使用。而且它本身就是基于Iterator實現(xiàn)的，但是由于類型轉(zhuǎn)換的問題，所以會比直接使用Iterator慢一點，但是還好，時間復雜度都是一樣的。所以怎么選擇，參考上面兩種方式，做一個折中的選擇。
    Java的最佳實踐是什么？
    Java數(shù)據(jù)集合框架中，提供了一個RandomAccess接口，該接口沒有方法，只是一個標記。通常被List接口的實現(xiàn)使用，用來標記該List的實現(xiàn)是否支持Random Access。
    一個數(shù)據(jù)集合實現(xiàn)了該接口，就意味著它支持Random Access，按位置讀取元素的平均時間復雜度為O(1)。比如ArrayList。
    而沒有實現(xiàn)該接口的，就表示不支持Random Access。比如LinkedList。
    所以看來JDK開發(fā)者也是注意到這個問題的，那么推薦的做法就是，如果想要遍歷一個List，那么先判斷是否支持Random Access，也就是 list instanceof RandomAccess。
    比如：
    if (list instanceof RandomAccess) {
    //使用傳統(tǒng)的for循環(huán)遍歷。
    } else {
    //使用Iterator或者foreach。
    }
    以上所述是小編給大家介紹的Java遍歷集合方法分析（實現(xiàn)原理、算法性能、適用場合），希望對大家有所幫助！

Java遍歷集合方法分析(實現(xiàn)原理、算法性能、適用場合)

字號： 小 中 大

Java遍歷集合方法分析(實現(xiàn)原理、算法性能、適用場合)

字號：小中大