<em id="lj1v3"><b id="lj1v3"></b></em>

    <i id="lj1v3"></i>

        <i id="lj1v3"><b id="lj1v3"><progress id="lj1v3"></progress></b></i>

        <video id="lj1v3"></video>
        <video id="lj1v3"></video>

                    <i id="lj1v3"><ol id="lj1v3"><progress id="lj1v3"></progress></ol></i>
                    巖石顯微圖像專題 II 區論文(已發表) ? 版本 ZH5 Vol 5 (3) 2020
                    下載
                    雅魯藏布江砂粒顯微圖像數據集
                    A photomicrograph dataset of sand grains from the Yarlung Tsangpo, Tibet
                    ?>>
                    : 2020 - 06 - 30
                    : 2020 - 09 - 01
                    : 2020 - 07 - 15
                    : 2020 - 09 - 25
                    极速快三
                    1971 28 0
                    摘要&關鍵詞
                    摘要:河流砂碎屑組分的鑒定和統計是物源分析的關鍵步驟,傳統顯微鏡鑒定和人工統計過程費時費力,所獲得的數據標準不一,質量參差不齊,不同實驗室所獲得的數據對比性較差。使用機器輔助技術實現碎屑組分自動鑒定是地質學家的夙愿。要實現這一目標,需要專業地質人員拍攝和標記顯微圖像文件作為訓練基礎?;跀祿_、共享的原則,作者將前期耗費大量時間和精力所標記的圖像數據集發表出來,供感興趣的地學、計算機等領域研究人員共享。本數據集包含8734個標記的碎屑顆粒的圖像和坐標文件,1876張高清砂粒顯微圖像,120張編號標記底圖和2個砂粒成分鑒定表。本數據集可作為機器學習訓練集,也可以作為鑒定其他河流砂碎屑組分的參考。
                    關鍵詞:砂粒;顯微圖像;沉積學;機器學習;雅魯藏布;河流砂
                    Abstract & Keywords
                    Abstract:?One of the key steps of river provenance analysis is to analyze and identify sand and sediment components. The traditional statistical processes are not only time-consuming and laborious, but yield data of uneven quality. Generated by different laboratories using different processing standards, these data more often lack value of contrast or comparison. While automatic identification through machine learning can potentially relieve geologists from such tedious and time-consuming work, a large number of microscopic images will be required for machine training. To facilitate data disclosure and sharing, the authors hereby publish a photomicrograph dataset of sand grains obtained from the Yarlung Tsangpo, Tibet, China. The dataset consists of 8734 tagged clastic particle images and corresponding coordinate information files, 1876 sand microscope images, 120 numbered base maps and two tables for sand composition identification, which we hope can provide good bases for the machine training of automatic sand component identification. It also provides references for identification of other river sand detrital components.
                    Keywords:?sand grains;?photomicrograph;?sedimentology;?machine learning;?Yarlung Tsangpo;?river sand
                    數據庫(集)基本信息簡介
                    數據庫(集)名稱雅魯藏布江砂粒顯微圖像數據集
                    數據作者董小龍,胡修棉,賴文
                    數據通信作者胡修棉(huxm@nju.edu.cn)
                    數據時間范圍河流砂樣品采集的時間為2016年6月;河流砂薄片偏光顯微照片拍攝于2019年。
                    地理區域樣品采自中國西藏自治區日喀則地區雅魯藏布江干流;GPS坐標為:29°19′13.5″N,88°51′28.4″E。
                    偏光顯微鏡分辨率4908×3264像素
                    數據量10.3 GB
                    數據格式*.jpg,*.xls,*.xml
                    數據服務系統網址https://dx.doi.org/10.11922/sciencedb.j00001.00035
                    基金項目第二次青藏高原科學考察研究項目(STEP,2019QZKK0204)
                    數據庫(集)組成數據集共包括3個數據文件,它們分別為:碎屑單顆粒標記圖片集data.zip、標記底圖.zip、砂粒信息表.zip。其中:(1) data是標記的圖像坐標文件(xml格式)和原始薄片偏光顯微照片(jpg格式),共1876張照片,數據量9.49 GB;(2)標記底圖是標記的顆粒的編號及其對應的顯微照片拍照視域,共120張照片,數據量911 MB;(3) 砂粒信息表是標記的砂粒的類型,共2份,數據量162 KB。
                    Dataset Profile
                    TitleA photomicrograph dataset of sand grains from the Yarlung Tsangpo, Tibet
                    Data corresponding authorHu Xiumian (huxm@nju.edu.cn)
                    Data authorsDong Xiaolong, Hu Xiumian, Lai wen
                    Time rangeModern river sand samples were collected in June 2016; Polarized photomicrographs of thin section were taken in 2019.
                    Geographical scopeThe sampling site is located at the trunk river of Yarlung Tsangpo in Xigaze, Tibet; GPS: 29°19′13.5″N & 88°51′28.4″E.
                    Polarized microscope resolution4908*3264 pixels
                    Data volume10.3 GB
                    Data format*.xml; *.jpg; *.xls
                    Data service system<https://dx.doi.org/10.11922/sciencedb.j00001.00035>
                    Source of fundingThe Second Tibetan Plateau Scientific Expedition and Research Program (STEP), Ministry of Science and Technology, China (Grant No. 2019QZKK0204).
                    Dataset compositionThe dataset includes three data files, including “photomicrographs for labeled single grain.zip”, “labeled base map.zip”, and “information table of single grain.xls”. (1) “Photomicrographs for labeled single grain.zip” stores the coordinates of all the sand grains(*.xml) and their 1876 polarized photomicrographs (*.jpg), with a data volume of 9.49 GB; (2) “Labeled base map.file” stores the serial number of the particles and their corresponding photomicrograph photographic field, with 120 photos totaling a data volume of 911 MB; (3) “Information table of single grain.xls” are data sheets for identification of sand grains in the thin sections, with a data volume of 162 KB.
                    引 言
                    砂或砂巖中碎屑顆粒的組分和含量是判定碎屑物源的重要依據。要獲得碎屑顆粒的組分和含量,傳統工作需要將砂或砂巖磨制成標準薄片,在偏光顯微鏡下采用Gazzi-Dickinson方法統計約400個顆粒[1]。然而,這種靠人眼在顯微鏡下逐顆粒識別統計的方法不僅所耗時間長,勞動強度大,而且受人的主觀認識和經驗的影響,所得到的統計數據的對比性較差。如何能把地質工作者從繁瑣耗時的碎屑統計中解脫出來,從而提高工作效率,是一個亟待解決的問題。
                    近年來,使用機器學習技術的計算機輔助方法已應用于煤巖組分的自動鑒定[2],礦石礦物的自動鑒定[3]和重礦物的自動識別[4],這不僅可以減少地質學家的工作量,并且可以提高鑒定的準確性,實現不同實驗室的數據對比?;跈C器學習算法的地質圖像分類方法首先通過提取地質圖像特征,如顏色、解理、結構和形狀等信息,在特征空間中構建對地質圖像的特征表示。然后使用機器學習算法學習不同類別特征間的差異,構建特征分類器,從而實現基于顯微圖像的碎屑顆粒自動鑒定和分類統計。
                    基于顯微圖像的碎屑組分自動鑒定技術,前期需要大量的由專業地質人員所標記的圖像數據集作為機器學習的樣本。然而,該類型的數據現在還處于空白,有許多想要利用已標記好的碎屑顆粒圖像數據集進行深度學習的計算機工作者苦于找不到公開發表的數據基礎?;跀祿蚕?,公開利用的原則,筆者將前期耗費大量時間和精力所拍照并逐一標記的顯微圖像數據集進行整理,并與大家共享。
                    1 ? 數據采集和處理方法
                    選取2016年6月采集于雅魯藏布江干流心灘河流砂樣品16A063(圖1),采樣標準參考[5,6,7,8 ],采集砂樣約2公斤,分成2份分別編號16A063-1和16A063-2。16A063-1用2000 μm和63 μm的篩網濕篩得到粒徑在63–2000 μm的砂樣,16A063-2用500μm和63μm的篩網濕篩得到粒徑在63–500 μm的砂樣。然后用分樣器多次均分樣品,最終得到約5 g砂樣,前后分兩批送往河北省廊坊誠信地質服務有限公司進行標準薄片磨制,獲得厚度為0.03 mm的標準光學薄片,其中薄片16A063-1顆粒膠結物為藍色環氧樹脂,薄片16A063-2顆粒膠結物為無色環氧樹脂。


                    圖1 ? 樣品位置圖(改自[10])
                    MBT:主邊界逆沖斷裂;STDZ:藏南拆離系;GKT:吉隆 -康馬斷裂;YTSZ:雅魯藏布縫合帶;LMF:洛巴堆-米拉山斷層;SNMZ:獅泉河-納木錯混雜巖帶。
                    拍攝顯微圖像時,先在薄片上畫出一定的矩形區域,以去掉邊緣不均勻的部分。然后在標準偏光顯微鏡下(顯微鏡型號Nikon ECLIPSE LV 100POL,目鏡10倍)進行底圖拍照,同時拍攝單偏光和正交偏光照片。拍照時有小部分重疊以便能完整拼接。根據砂粒大小,薄片16A063-1選用2.5倍物鏡進行底圖拍攝,選用10倍物鏡進行單顆粒圖像拍照。薄片16A063-2選用5倍物鏡進行底圖拍攝,選用20倍物鏡逐一拍攝單顆粒圖像。薄片拍照和信息采集方法統一按《巖石顯微圖像專題》的標準執行[9],系統采集了砂薄片顯微圖像。采集的每張單顆粒圖像視域均在底圖上框出,以便能快速找到每張顯微照片的位置。采集完偏光顯微圖像后,按照劃分的17種顆粒類型進行逐顆粒鑒定,將鑒定的結果在底圖上標出,用折線將標記的顆粒相連,折線中每個拐點所在的位置代表一個顆粒,按照順序以間距為10進行編號,同時在Excel表中對每個顆粒進行編號,以方便后期顆粒標記(圖2)。將拍攝的單顆粒圖像文件用專業標記軟件LabelImg打開并對每張圖片上的每一個顆粒進行標記,得到樣本的標記數據集。LabelImg是一款開源的標注工具,使用版本為windows_v1.5.0(下載網址:http://tzutalin.github.io/labelImg/)。


                    圖2 ? 砂粒顯微圖像拍照編號流程圖
                    2 ? 數據樣本描述
                    本數據集由3部分組成,分別為data文件夾、標記底圖文件夾和砂粒信息表文件夾。共包含不同類別的砂粒8734顆,砂薄片顯微圖像1996張,其中單顆顯微圖像1876張,標記底圖照片120張。粒砂粒按照6大類17小類進行分類(表1),分類標準參考[1],對于石英僅區分單晶石英和多晶石英,長石區分斜長石和鉀長石,本數據集未再進行細分。不同類型的砂粒數量見表2。
                    表1 ? 砂粒分類及縮寫表
                    縮寫英文全稱中文名稱備注
                    QmMonocrystalline quartz單晶石英Q=Qm+Qp
                    QpPolycrystalline quartz多晶石英
                    QTotal quartz石英
                    PPlagioclase feldspar斜長石F=P+K
                    KPotassium feldspar鉀長石
                    FFeldspar長石
                    LvfAcid-intermediate volcanic rock fragments中-酸性火山巖巖屑Lv= Lvf+ Lvm+ Lvi
                    LvmMafic volcanic rock fragments基性火山巖巖屑
                    LviIntrusive rock fragments侵入巖巖屑
                    LvVolcanic rock fragments火成巖巖屑
                    LscCarbonate grain碳酸鹽巖巖屑Ls=Lsc+Lsm+Lss+Cht
                    LsmMudstone or shale grain泥巖或頁巖巖屑
                    LssSandstone & siltstone砂巖或粉砂巖巖屑
                    ChtChert fragments硅質巖巖屑
                    LsSedimentary rock fragments沉積巖巖屑
                    LmlSlate fragments板巖巖屑Lm=Lml+Lmp+Lms+Lmu+Lmc
                    LmpPhyllite fragments千枚巖巖屑
                    LmsSchist fragments片巖巖屑
                    LmuMetamorphic rock fragments of ultramafic rocks超基性變質巖(如蛇紋巖)
                    LmcLithic grains of marble大理巖巖屑
                    LmMetamorphic rock fragments變質巖巖屑
                    其他重礦物、不透明礦物,無法識別礦物
                    表2 ? 薄片16A063-1和16A063-2顆粒數量和顯微圖片數量統計表(顆??s寫見表1)
                    QmQpPKLvfLvmLviLscLsmLss
                    16A063-1132882224114172112296049
                    16A063-2342829044547715626460161100
                    總數47563726691618871728489221149
                    ChtLmlLmpLmsLmuLmc其他顆??倲?/b>照片數
                    16A063-11526223001962369374
                    16A063-230558842250663651502
                    總數4571201072270287341876
                    備注
                    16A063-1其他=重礦物(187)+不透明礦物(7)+無法識別礦物(2)
                    16A063-2其他=重礦物(338)+不透明礦物(163)+無法識別礦物(5)
                    2.1 ? 碎屑單顆粒標記圖片集
                    全部數據集信息保存為data壓縮文件。data文件中包含:image文件夾,annotation文件夾和類別注釋predefined classes文件。annotation文件夾包含與image文件夾中圖片一一對應的標注文件(圖3)。這樣的文件組織格式方便計算機進行讀取。


                    圖3 ? 顯微圖像數據組成圖
                    圖像標注工作使用LabelImg軟件完成,在LabelImg軟件中打開砂粒圖像,手動標注顆粒位置及類別。由于單偏光圖像與正交偏光圖像顆粒位置一一對應,故僅需對單偏光圖像進行標記。計算機可以根據單偏光標記的位置坐標自動提取正交偏光顯微照片的顆粒位置。標記信息以xml格式保存在annotation文件中。annotation文件中的每個顆粒標記坐標文件可用軟件Notepad++,版本為windows_v7.8.8(下載地址:https://notepad-plus-plus.org/downloads/v7.8.8/)打開。標記的圖片位置用LabelImg打開時,需要將圖片文件夾名稱與標記保存的xml文件夾名稱對應(圖4A兩個紅色方框位置),才能顯示標記位置。


                    圖4 ? 顆粒標記示意圖
                    (A)LabelImg標記單偏光圖片,存放于annotation文件中;(B)對應的原始偏光顯微圖片,存放于Image文件中
                    砂粒照片數據集image文件夾共包含1876張單顆粒偏光顯微照片組成,每一個單顆粒視域都包含單偏光顯微照片和正交偏光顯微照片各一張,顯微照片編號樣式為“a1-”和“a1+”,“a1”為對應底圖拍照視域的位置,“-”表示單偏光照片,“+”表示正交偏光照片(圖4B)。顯微照片顏色與偏光顯微鏡下的肉眼觀察一致。顯微照片的分辨率為4908×3264,保存格式為JPG。
                    2.2 ? 標記底圖
                    標記底圖文件夾中共有120張標記好的顯微圖像照片。其中文件名“a*標”為10倍或20倍鏡下拍攝的單顆粒照片視域(圖5A);文件名“a*-1”為對應的“a*標”視域,用折線將每個鑒定編號的顆粒相連,以10為間距依次編號(圖5B)。


                    圖5 ? 標記底圖示例
                    (A)單顆粒照片視域位置圖,編號“a1標”;(B)顆粒順序編號圖,編號“a1-1”
                    2.3 ? 砂粒信息表數據子集
                    砂粒信息表為兩張薄片16A063-1和16A063-2的顆粒鑒定結果,信息表中的編號與底圖“a*-1”的編號順序相一致(圖5B)。單顆粒的鑒定結果按照底圖標定的順序以縮寫的形式填寫在砂粒信息表中。在薄片16A063-1將強烈蝕變的斜長石(P)和鉀長石(K)分別標記為P1和K1,以示區別。不同的顆粒所占總體的比例如圖6。


                    圖6 ? 薄片16A063-1和薄片16A063-2不同類型砂粒組成比例圖(顆??s寫見表1)
                    3 ? 數據質量控制和評估
                    巖石薄片樣本符合國家與國際標準的厚度。在本次顯微照片拍攝和薄片鑒定過程中,同一批次的巖石薄片中觀察到石英顆粒的干涉色均為一級干涉色,說明薄片的厚度符合0.03 mm的國家標準。顯微照片高清且無色差。在顯微鏡拍攝過程中,采用自動曝光和自動白平衡,使得肉眼觀察和系統照片顏色盡量保持一致;且顯微照片的分辨率統一采用拍照系統的最高值4908×3264像素,圖片統一保存為jpg格式;故而顯微照片的質量與清晰度是可靠的。每張照片都添加有比例尺,為后期顆粒大小的測量、圓度計算、面積計算提供便利。
                    砂粒的鑒定是研究者共同討論的結果,以確保鑒定結果的準確性。
                    本數據集提供大量的已標記的砂粒圖像和標記的坐標文件,每張顆粒顯微照片的每個顆粒均進行標記,可以獲得每個顆粒的坐標值和對應的顆粒類型。同時標記過程中在底圖上標出顆粒圖像的視域位置并進行顆粒編號,使得每個標記顆粒的位置和類型可追蹤。后面的使用者可以進行校驗。
                    數據的不足之處在于數據結構不均衡,有的顆粒類型數量非常多,如石英顆粒,有的顆粒類型非常少,如變質巖巖屑(圖6)。這使得基于機器學習技術的圖像識別結果的準確性參差不齊,有待下一步繼續對數據集進行補充,減少數據庫內各顆粒類型的數量差距。由于人工移動載物臺,拍照視域和底圖視域稍有偏差,但不影響快速定位。部分顆粒在底圖上未標出,但用LabelImg標記時每張圖片中出現的顆粒均標出其坐標位置和顆粒類型,以利于計算機讀取。
                    4 ? 數據價值
                    本數據集包含大量標記好的單顆粒圖片和坐標文件,是利用機器學習技術實現砂粒中的礦物和巖屑自動鑒定的重要數據基礎。大量已鑒定的單顆粒照片可以作為鑒定圖版使用。砂粒的分類可為后續的河流砂研究提供參考標準,提高不同實驗室所獲碎屑數據的可比較性?,F代河流砂砂粒的鑒定特征可以為砂巖成分的鑒定提供參考依據,幫助我們理解古代砂巖的特征。
                    5 ? 數據使用方法和建議
                    本數據集中3個文件的關聯性較強,內容相對應,使用時注意以下幾點:
                    (1)數據集中出現的薄片,都集中統一保存在南京大學胡修棉教授課題組。如果以上數據集中提供的顯微照片不能滿足進一步的研究需要,可以聯系通信作者申請進一步使用。
                    (2)數據使用時3個文件應同時下載使用,以便能迅速找到每個顆粒的位置信息和顆粒類型,在使用標記的annotation標記文件時,應提前下載好標記軟件LabelImg(具體安裝步驟可參考https://blog.csdn.net/qq_38451119/article/details/83036495)和坐標文件讀取軟件Notepad++,以讀取顆粒圖像和坐標。用LabelImg打開圖像文件時,應將標記的保存目錄更改為與圖像文件相對應的文件名下,才能顯示標記的圖框位置。如在使用中有任何問題請聯系本文作者。
                    (3)單顆粒的砂粒照片可以作為河流砂碎屑鑒定的標準圖版,部分具有典型結構的碎屑顆??梢灾苯佑糜诮虒W和圖書出版。
                    數據可用性聲明 ?
                    由于本數據集正在進行相關的研究,特此對該數據集申請保護3年。保護期間讀者可以登錄網站https://dx.doi.org/10.11922/sciencedb.j00001.00044,下載部分數據集內容供理解和參考。保護期后讀者登錄科學數據存儲庫官網下載和使用數據,訪問和下載網址:https://dx.doi.org/10.11922/sciencedb.j00001.00035。
                    致 謝
                    感謝李超、馬安林博士在薄片顆粒鑒定中的有益討論;感謝郭榮華采集野外樣品。
                    [1]
                    Ingersoll R V. The effect of grain size on detrital modes; a test of the Gazzi-Dickinson point-counting method[J]. Journal of Sedimentary Research, 1984, 54(1): 103-116.
                    [2]
                    宋孝忠, 張群. 煤巖顯微組分組圖像自動識別系統與關鍵技術[J]. 煤炭學報, 2019, 44(10): 3085-3097.
                    [3]
                    徐述騰,周永章. 基于深度學習的鏡下礦石礦物的智能識別實驗研究[J]. 巖石學報, 2018, 34(11) : 3244-3252.
                    [4]
                    HAO H Z, GUO R H, GU Q, et al. Machine learning application to automatically classify heavy minerals in river sand by using SEM/EDS data[J]. Minerals Engineering, 2019, 147. https://doi.org/10.1016/j.mineng.2019.105899.
                    [5]
                    Garzanti E. Petrographic classification of sand and sandstone[J]. Earth-Science Reviews, 2019, 192:545-563.
                    [6]
                    Garzanti E, Vezzoli G, Andò S, et al. Petrology of Indus River sands : a key to interpret erosion history of the Western Himalayan Syntaxis[J]. Earth and Planetary ence Letters, 2005, 229(3-4): 287-302.
                    [7]
                    Garzanti E, Vezzoli G, Andò S, et al. Sand petrology and focused erosion in collision orogens: the Brahmaputra case[J]. Earth and Planetary ence Letters, 2004, 220(1): 157-174.
                    [8]
                    Garzanti E, Limonta M, Vezzoli G, et al. Petrology and multimineral fingerprinting of modern sand generated from a dissected magmatic arc (Lhasa River, Tibet)[M]// Ingersoll R V, Lawton T F, Graham S A. Tectonics, Sedimentary Basins, and Provenance: A Celebration of William R. Dickinson’s Career. The Geological Society of America, 2018: 197-221.
                    [9]
                    胡修棉, 賴文, 許藝煒, 等. 沉積巖顯微數字圖像數據的獲取與信息收集標準[J/OL]. 中國科學數據, 2020. (2020-03-02). DOI: 10.11922/csdata.2020.0008.zh.
                    [10]
                    GUO R H, HU X M, Garzanti E, et al. How faithfully the geochronological and geochemical signatures of detrital zircon, titanite, rutile and monazite record magmatic and metamorphic events? A case study from the Himalaya and Tibet[J]. Earth Science Review, 2020. https://doi.org/10.1016/j.earscirev.2020.103082.
                    數據引用格式
                    董小龍, 胡修棉, 賴文. 雅魯藏布江砂粒顯微圖像數據集[DB/OL]. Science Data Bank, 2020. (2020-07-15). DOI: 10.11922/sciencedb.j00001.00035.
                    稿件與作者信息
                    論文引用格式
                    董小龍, 胡修棉, 賴文. 雅魯藏布江砂粒顯微圖像數據集[J/OL]. 中國科學數據, 2020, 5(3). (2020-09-21). DOI: 10.11922/csdata.2020.0051.zh.
                    董小龍
                    Dong Xiaolong
                    主要承擔工作:薄片鑒定、薄片拍照、砂粒的標定、論文撰寫。
                    (1993—),男,四川眉山市人,碩士生,研究方向為現代河流砂。
                    胡修棉
                    Hu Xiumian
                    主要承擔工作:數據集的設計、論文撰寫。
                    huxm@nju.edu.cn;
                    (1974—),男,江西省南昌市人,博士,教授,研究方向為沉積學。
                    賴文
                    Lai Wen
                    主要承擔工作:薄片鑒定、論文撰寫。
                    (1992—),男,江西省贛州市人,博士,助理研究員,研究方向為大地構造沉積學。
                    出版歷史
                    I區發布時間:2020年7月15日 ( 版本ZH2
                    II區出版時間:2020年9月25日 ( 版本ZH5
                    翻譯版出版時間:2020年9月25日 ( 版本EN1
                    參考文獻列表中查看
                    中國科學數據
                    csdata