午夜福利电影,少妇被躁爽到高潮无码人狍大战,小太正裸体脱裤子无遮挡

如何使用Python分析姿態(tài)估計數(shù)據(jù)集COCO？

2021-01-16 09:50

當我們訓練姿勢估計模型，比較常用的數(shù)據(jù)集包括像COCO、MPII和CrowdPose這樣的公共數(shù)據(jù)集，但如果我們將其與不同計算機視覺任務(wù)（如對象檢測或分類）的公共可用數(shù)據(jù)集的數(shù)量進行比較，就會發(fā)現(xiàn)可用的數(shù)據(jù)集并不多。姿態(tài)估計問題屬于一類比較復(fù)雜的問題，為神經(jīng)網(wǎng)絡(luò)模型建立一個合適的數(shù)據(jù)集是很困難的，圖像中每個人的每個關(guān)節(jié)都必須定位和標記，這是一項瑣碎而費時的任務(wù)。最流行的姿態(tài)估計數(shù)據(jù)集是COCO數(shù)據(jù)集，它有大約80類圖像和大約250000個人物實例。如果你檢查此數(shù)據(jù)集中的一些隨機圖像，你可能會遇到一些與要解決的問題無關(guān)的實例。學術(shù)界希望達到最高的精度，但在實際生產(chǎn)環(huán)境中并不總是如此。在現(xiàn)實世界中，我們可能更感興趣的是在非常特定的環(huán)境中工作良好的模型，例如行人、籃球運動員、健身房等。讓我們從COCO數(shù)據(jù)集中查看此圖像：

你看到紅點了嗎？這是關(guān)鍵點：鼻子。有時，你可能不希望網(wǎng)絡(luò)看到僅包含頭部一部分的示例，尤其是在幀的底部。在這篇文章中，我會向你展示COCO數(shù)據(jù)集的一個示例分析COCO數(shù)據(jù)集COCO數(shù)據(jù)集是用于許多計算機視覺任務(wù)的大規(guī)模通用數(shù)據(jù)集。150萬個對象實例，80個對象類別，25萬人——這些都讓這個數(shù)據(jù)集令人印象深刻。你可以在源站點上找到更多詳細信息，在那里你還可以下載所有必需的文件：https：／／cocodataset．org／數(shù)據(jù)集由圖像文件和注釋文件組成。注釋文件是一個JSON，包含關(guān)于一個人（或其他一些類別）的所有元數(shù)據(jù)。在這里我們會找到邊界框的位置和大小，區(qū)域，關(guān)鍵點，源圖像的文件名等。我們不必手動解析JSON。有一個方便的Python庫可用使用，即pycocotools（https：／／github．com／cocodataset／cocoapi／tree／master／PythonAPI）我們需要train2017．zip（https：／／cocodataset．org／＃download），val2017．zip（https：／／cocodataset．org／＃download），annotations＿trainval2017．zip（https：／／cocodataset．org／＃download）具體來說，我們只需要人的注釋。zip中有兩個文件：annotations＿trainval2017．zip：person＿keypoints＿train2017．json和person＿keypoints＿val2017．json我建議將文件放在以下這個文件夾層次結(jié)構(gòu)中：dataset＿coco
｜－－－annotations
｜－－－person＿keypoints＿train2017．json
｜－－－person＿keypoints＿val2017．json
｜－－－train2017
｜－－－＊．jpg
｜－－－val2017
｜－－－＊．jpg
下面是顯示如何加載注釋的代碼：from pycocotools．coco import COCO
．．．
train＿annot＿path ＝＇dataset＿coco／annotations ／person＿keypoints＿train2017．json＇
val＿annot＿path ＝＇dataset＿coco／annotations／person＿keypoints＿val2017．json＇
train＿coco ＝ COCO（train＿annot＿path）＃加載訓練集的注釋
val＿coco ＝ COCO（val＿annot＿path）＃加載驗證集的注釋
．．．
＃函數(shù)遍歷一個人的所有數(shù)據(jù)庫并逐行返回相關(guān)數(shù)據(jù)
def get＿meta（coco）：
ids ＝ list（coco．imgs．keys（））
for i， img＿id in enumerate（ids）：
img＿meta ＝ coco．imgs［img＿id］
ann＿ids ＝ coco．getAnnIds（imgIds＝img＿id）
＃圖像的基本參數(shù)
img＿file＿name ＝ img＿meta［＇file＿name＇］
w ＝ img＿meta［＇width＇］
h ＝ img＿meta［＇height＇］
＃檢索當前圖像中所有人的元數(shù)據(jù)
anns ＝ coco．loadAnns（ann＿ids）
yield ［img＿id， img＿file＿name， w， h， anns］
．．．
＃迭代圖像
for img＿id， img＿fname， w， h， meta in get＿meta（train＿coco）：
．．．
＃遍歷圖像的所有注釋
for m in meta：
＃ m是字典
keypoints ＝ m［＇keypoints＇］
．．．
．．．
首先，我們必須加載COCO對象，它是json數(shù)據(jù)的包裝器（第6－7行）在第11行，我們加載所有圖像標識符。在接下來的幾行中，我們?yōu)槊總€圖像加載元數(shù)據(jù)，這是一個包含圖像寬度、高度、名稱、許可證等一般信息的詞典。在第14行，我們加載給定圖像的注釋元數(shù)據(jù)，這是一個字典列表，每個字典代表一個人。第27－32行顯示了如何加載整個訓練集（train＿coco），類似地，我們可以加載驗證集（val＿coco）將COCO轉(zhuǎn)換為Pandas數(shù)據(jù)幀讓我們將COCO元數(shù)據(jù)轉(zhuǎn)換為pandas數(shù)據(jù)幀，我們使用如matplotlib、sklearn 和pandas。這可用使得數(shù)據(jù)的過濾、可視化和操作變得更加容易，此外，我們還可以將數(shù)據(jù)導(dǎo)出為csv或parquet等。def convert＿to＿df（coco）：
images＿data ＝［］
persons＿data ＝［］