第一页欧美-第一页综合-丁香花成人另类小说-丁香久久-顶级欧美色妇xxxxbbbb

學術咨詢

讓期刊論文更省時、省事、省心

理論與數據雙驅動的社會分層研究

時間:2021年12月20日 分類:科學技術論文 次數:

[摘要]以往社會分層研究的理論和方法可以歸納為理論和數據驅動兩種范式,通過回顧和比較,發現其都存在不可避免的局限性,為此提出一種結合二者優勢的理論與數據雙驅動的社會分層研究框架。該框架將社會階層看作由類別和等級參數所構成的高維社會空間中聚集的子群體,基

  [摘要]以往社會分層研究的理論和方法可以歸納為理論和數據驅動兩種范式,通過回顧和比較,發現其都存在不可避免的局限性,為此提出一種結合二者優勢的理論與數據雙驅動的社會分層研究框架。該框架將社會階層看作由類別和等級參數所構成的高維社會空間中聚集的子群體,基于分層理論所提出的階層測量指標建構“社會階層空間”,并使用機器學習算法識別出空間中的不同群體,從而進行階層劃分。使用這一框架對CGSS2017的數據進行階層劃分,發現其既能區分出地位一致性高的、邊界清晰的階層,也能對地位不一致的、還未形成階層的利益群體進行準確識別。此外還發現:(1)將當前中國社會劃分為三個階層是最好的劃分方式,三個社會階層在經濟、聲望、文化等維度上的特征分布都存在高、中、低的等級差異;(2)分層的指標并不是越多越好,對中國當前社會階層劃分和對個體階層測量最有意義的指標是單位類型,其次是職業社會經濟地位。

  [關鍵詞]社會分層;理論驅動;數據驅動;機器學習;社會階層空間;階層測量方法

社會分層

  社會結構是社會學的核心議題,作為社會結構最重要的維度,階層結構的研究對于理解社會現象和社會變遷有著重要的意義,一直以來廣受國內外社會學家的關注,發展出了豐富的社會分層理論,并在此基礎上提出了不同的階層測量方法。總體來看,國內外學者對階層的理解可分為兩種:

  一種認為階層是等級不同的群體,只需確定一定的數量標準就可以對社會階層進行區分,例如按照收入的高低劃分為低收入群體、中等收入群體和高收入群體;另一種認為階層是社會性質、社會屬性完全不同的群體,而不僅僅是簡單的上下排列的等級層次,因此需要找到階層之間屬性差異的指標來界定。傳統的社會分層理論(如馬克思、韋伯和涂爾干的分層理論)都體現了將階層看作屬性不同的群體這一階層視角,即根據生產資料的占有、勞動分工等差異來界定階層[1]。社會學對階層結構的測量常常將兩種視角結合起來,既考慮群體的社會屬性差異,同時關注社會屬性的等級層次,而用于分層的社會屬性常常被理解為“對各類資源的占有”。李強[1]認為,社會分層的本質是資源在不同群體中的分布。

  因此,資源的種類和占有水平是階層和社會地位劃分的依據。他將格倫斯基提出的用于分層的七種資源[2]擴展為十種,分別是生產資料資源、財產或收入資源、市場資源、職業或就業資源、政治權力資源、文化資源、社會關系資源、主觀聲望資源、公民權利資源以及人力資源。這十種資源各有側重,其不同組合可以形成不同的分層標準,而不同的分層組合所劃分的階層群體又常常相互交叉,即在一種標準下被劃分為同一個階層的群體在另一種標準下可能被分為不同的階層群體。

  基于不同的資源組合和不同的劃分標準,社會學發展出了不同的階層測量方法。但筆者發現,這些方法都存在一定的局限性:一方面,不同分層模型測量階層地位時選用的維度(資源種類)和劃分標準(資源占有水平)不同;另一方面,這些方法都面臨著“分層結果無法在現實中驗證”的批判。因此,本文嘗試提出一種理論和數據雙驅動的階層測量,在更全面地考慮階層測量維度的基礎上,使用數據驅動的方式從現實出發進行階層劃分。

  一、兩種階層測量范式

  社會分層研究的首要任務是界定社會階層,階層測量需要研究者制定出分層的指標對社會階層進行劃分。自馬克思以來,社會理論家和社會學研究者提出了大量的階層測量理論和方法,對社會分層指標、測量方法和劃分方式進行了界定和討論,發展出了理論驅動和數據驅動兩種研究范式。

  (一)理論驅動的階層測量傳統的階層測量均屬于理論驅動范式。在這一范式下,社會分層的研究者在階層測量上存在兩種不同的取向:一種是階級分析,一種是職業分層。前者多使用類別型(categorical)的階級測量方法,本文稱之為階層歸類法;后者多使用連續型(continuous)的階層測量方法,本文稱之為數值測量法。階層歸類法是指研究者基于社會分層理論探索出一些有重要經濟社會差異的大的階級類別,然后將社會人群納入這些大的類別,社會學分層理論最重要的兩種階層圖示——賴特階級分類模型和EGP階級圖式都屬于這一類測量方法[1,3-4]。

  賴特階級分類模型是根據不同社會群體圍繞物質生產資料、勞動力、組織和技術四種資產所產生的占有(控制)和剝削關系進行的階級分類[3];戈德索普等提出的EGP圖式主要是依據職業信息進行的階層劃分,根據職業聲望、職業的市場地位(職業的經濟收入來源和收入水平、經濟保障狀況和經濟提升、職業的技術能力等)、工作地位(管理權限、工作自主程度等)以及雇傭關系等特征對職業社會階層地位進行劃分[4-7]。

  數值測量法是指研究者基于特定的特征計算出一個有高低等級的、連續的數值作為界定階層地位的指標,其典型代表是職業聲望量表(OccupationPrestigeScale,OPS)和社會經濟地位指數(SocioeconomicIndex,SEI)。職業聲望量表是通過調查的方式來了解人們對國家或國際職業分類標準中的職業評價,從而計算出職業聲望的評估標準[8]。目前大多數學者使用的職業聲望量表是特萊曼整合60個國家與地區的85套職業聲望調查數據所提出的較為穩定的、可以用于跨國比較分析的國際標準職業聲望量表(StandardInternationalOccupationalPrestigeScale,SIOPS)[9-11]。

  社會經濟地位測量則是使用每一類職業的平均教育水平和平均收入對該類型的職業聲望進行回歸,并基于回歸方程來估計所有職業的社會經濟地位指數[12-15],目前所使用的社會經濟地位指數是1992年甘澤布姆等根據國際標準職業編碼(InternationalStandardClassificationofOccupations,ISC)提出的國際標準社會經濟地位量表(InternationalSocio-EconomicIndexofOccupationalStatus,ISEI)。這一量表給出了每一個職業對應的ISCO、ISEI、SIOPS,并與十等級的EGP階層分類相對應[16-17]。隨著社會的發展,國際標準職業編碼在不斷更新,IESI也進行了相應的更新。

  (二)數據驅動的階層測量

  隨著大數據和計算社會科學的發展,數據驅動的階層測量方法逐漸興起,并在學術界和業界得到了廣泛應用。與傳統階層測量方法不同,數據驅動的階層測量主要是用于估計個體或家庭的社會經濟地位(SocioconomicStatus,SES),而不以研究整個社會的階層結構為目的。

  社會經濟地位是指基于個體或家庭的受教育水平、收入水平和職業水平而形成的在經濟層面和社會層面相對于他人的社會位置,并且通常被劃分為高、中、低三個等級[18]。傳統的SES測量主要使用調查數據來獲取決定SES的教育、收入、職業等傳統社會分層理論所關心的階層測量維度直接進行劃分,而數據驅動的階層測量主要依據大數據來測量個體的社會經濟地位。由于大數據難以獲取經濟資源、職業資源、聲望資源等理論驅動分層所關注的數據,而更多地包含社交網絡和生活方式等社會資本和文化資本信息。

  因此,基于不同社會經濟地位的群體擁有不同生活方式和社會網絡的觀點[19-20],數據驅動的階層測量主要使用手機或互聯網獲取的用戶行為、社交網絡以及環境(如居住區域)數據等,通過一定的算法對個體或家庭的社會經濟地位進行預測和估計。在使用生活方式特征預測階層地位的研究中,研究者從多個生活方式的多個維度預測個體的SES,如活動軌跡、電話溝通模式、消費模式、社交媒體上討論的話題以及使用的語言和社交媒體上的表現等。其方法一般是將手機或社交媒體上記錄的海量個體行為數據轉化為結構化的數據(即個案—變量式的數據),用以刻畫個體生活方式的特征,然后根據這些特征來預測個體的SES等級、收入或職業類別[21-25]。

  在使用社會網絡特征進行預測時,研究者通常依據社會網絡分析(SocialNetworkAnalysis,SNA)中整體網分析的各項網絡結構指標(如中心性、度分布等)[26],而非個體及其朋友的社會人口屬性來預測個體的SES。根據生活方式或社會網絡特征預測個體或家庭的SES等級后,還需要結合直接測量SES的相關數據——如用戶居住小區的房價、普查或社會調查發布的地區社會經濟水平、用戶的職業類別等——作為用戶的“真實”SES,來驗證基于行為和網絡預測的準確性。

  由此可見,數據驅動的階層測量實際上把階層測量作為一個分類任務去完成,研究者基于個體的行為或社會網絡特征,采用機器學習的方法對用戶進行分類,并通過特征篩選、優化算法等方式來提高分類的準確性。在實際操作中,支持向量機(SupportVectorMachine,SVM)、隨機森林(RandomForest)等有監督機器學習分類方法和詞聚類與詞嵌入(wordclusterandembedding)、均值聚類(Meansclustering)等無監督聚類方法常被用于劃分用戶的SES等級。

  (三)兩種階層測量范式的比較

  通過對理論與數據驅動的階層測量方法及其理論依據進行梳理,發現理論驅動的階層測量更關注經濟資源(如生產資料的占有、收入與財富等)、與經濟資源直接相關的資源(如職業類別、市場資源、勞動關系等權力資源以及受教育程度、技能水平等人力資本)以及聲望資源;而并未將(除人力資本外的)文化資本和社會網絡資源納入社會分層的維度;而數據驅動的階層測量正好相反,只考慮文化資本和社會網絡資源,實際上這種分異的產生是由于數據和方法的局限性。

  在理論驅動的階層測量發展之時,研究者只能使用調查數據進行研究,調查數據中更多地包含教育、收入、職業等核心變量,而較少包含生活方式數據;在分析方法上,由于人腦的思考維度是有限的,理論驅動的分層模型只能考慮有限維度的社會屬性,無法處理高維的特征,加之傳統的實證分析大多采用線性模型,由于存在地位不一致的可能,階層地位并不一定是各種資源的線性組合。

  因此,研究者只能選用更重要的維度對階層進行測量。由于每種理論驅動的方法都只考慮特定維度的資源,在階層劃分的方式上也存在差異,因此不同流派的分層研究者對究竟應該如何進行劃分爭論不休[27-29]。此外,不同國家或地區、不同時期的社會發展情況存在差異[30],研究者基于不同的數據測量出的階層結構能在多大程度上反映社會現實也難以驗證[31]。對于數據驅動的階層測量而言,手機和互聯網產生的大數據主要是對個體使用痕跡的記錄,通過這些記錄很容易得出個體的移動軌跡、通話模式以及社交媒體上的信息。

  因此,基于大數據的階層測量只能根據文化和社會網絡等信息來推測。但由于大數據很難獲取教育程度、收入、職業等隱私信息,通常用社區房價、地區SEL等作為替代,因此對SES的預測結果難以驗證;此外,若特征維度較高,過于復雜的黑箱算法也使得分層結果難以解釋。

  實際上,很多大型社會綜合調查的數據包含行為、態度、生活方式等文化資本和社會網絡的數據,只是因方法的限制使得研究者未能將其納入階層測量中;而機器學習方法和技術不僅可以用于大數據的分析,同樣可以用于調查數據的分析。為克服純理論和純數據驅動的階層測量方法的不足,本文嘗試將兩種方法的優勢結合起來,提出一種理論與數據雙驅動的階層測量方法。

  二、理論與數據雙驅動的階層測量方法——基本框架設計

  階層測量的目的是為了分析社會的階層結構,從而分析結構形成的原因及其影響。因此,研究者所得出的階層結構必須符合社會現實。然而,有學者對我國分層研究的四種模式進行分析后提出了尖銳的批評,認為“關于中國分層的幾種不同模型只不過是幾種不同的關于當前中國社會分層狀況的概念或分類游戲而已,并且四種模型經過一番操作能夠實現相互轉化”,并認為“關于當代中國社會分層狀況的幾種模式,其是非對錯本質上與‘事實’①無關,因而也不可能通過將它們與‘事實’對比,看誰更符合‘事實’(或能獲得更多‘事實’支持)的方法來對它們的是非對錯加以判斷。

  它們之間的差異,實質上只是幾種關于社會分層之話語系統之間的差異”[31-32]。這一觀點啟發了筆者,即在進行階層劃分時應該從社會事實出發進行階層結構測量,避免從理論上對階層進行定性的分類。但如何根據社會事實來劃分階層?前文提到,階層是社會屬性和等級不同的群體,是對不同資源占有水平不同的群體,那么階層劃分就是根據社會成員的屬性和等級將社會成員劃分為不同的群體,而如何選擇用于區分階層的屬性和等級,則需要借助分層理論的幫助。基于這一觀點,本文建構了理論和數據雙驅動的階層測量框架。

  (一)社會結構、布勞空間與社會階層

  布勞在《不平等與異質性》中建構了其宏觀社會結構理論,認為社會結構可以用類別參數和等級參數來描述。類別參數是指將人口平行地劃分為界限明確的若干個亞群體的特征,包括性別、種族、宗教、國籍、居住地、語言、職業、婚姻狀況等;等級參數是將人口按高低秩序劃分為若干層次的特征,包括教育、收入、財富、權力等。布勞認為,社會結構的分化一般有異質性和不平等兩種形式,異質性是水平分化,指人口在由類別參數所表示的各群體之間的分布;不平等是垂直分化,指由等級參數所表示的地位分布。此外,他還用相交性表示社會結構中幾條軸線的人口分布共變情況。

  類別參數和等級參數構成了多維空間,而人口在這一多維空間中的分布則構成社會結構[33-34]。這一“多維空間”被命名為布勞空間,所有社會人口特征都是布勞空間的潛在坐標軸[35-36]。社會階層是社會結構最核心的維度,因此可以認為,社會階層是由類別參數和等級參數共同決定的。如上文所述,不同社會階層既是異質性的群體,也是在等級秩序的階梯中占有不同位置的群體。

  因此,參照社會結構的定義,可以將社會階層看做是人口在由類別參數和等級參數所構成的高維社會空間中的分布所形成的次級群體,那么階層劃分就是去識別這些群體。基于這一思想,本文建構了理論與數據雙驅動的階層測量框架:第一步,建構社會階層空間,即基于分層理論提出的對階層劃分有意義的資源(階層測量的維度),將其操作化為可測量的變量作為社會空間的維度,建構出社會空間;第二步,使用無監督聚類的方法識別在高維社會空間中形成的次級群體,從而進行階層劃分。

  (二)社會階層空間的建構與分割

  建構社會階層空間需要先描繪出社會空間的“軸線”,即定義用于階層劃分的維度。李強總結了過往分層理論所使用的階層劃分的10種資源:生產資料資源、財產或收入資源、市場資源、職業或就業資源、政治權力資源、文化資源、社會關系資源、主觀聲望資源、公民權利資源以及人力資源。

  但這一分類過于細致,導致這10種資源并非互斥,如文化資源包含了人力資本,職業或就業資源中也包含收入、生產資料和市場資源等信息,在操作化時較難進行測量。陸學藝[27]根據我國特色,將階層劃分要素綜合為五個:職業或勞動分工、經濟資源、組織資源(也稱權力資源)、文化(技術)資源和單位地位或制度分割,但這種歸類也忽視了社會網絡資源、除人力資本外的文化資本以及聲望資源和公民權力。在對二者進行綜合的基礎上,本文將用于社會分層的要素歸納為七類,分別是:

  (1)經濟資源,主要指收入狀況,包括個人收入與家庭收入;(2)職業與聲望,整合了組織資源(有無管理權限)、職業資源(職業類型、工作狀況)和職業聲望;(3)單位地位或制度分割,包括戶口、單位類型、體制以及黨員身份等;(4)社會資本;(5)民權資源;(6)人力資本;(7)文化資本;主要包括人力資本以外的其他文化資本,如生活方式、消費結構等。之后結合獲取數據的情況將上述要素操作化為可測量的變量,即社會空間的坐標軸。構建好社會空間的下一步是進行階層劃分。

  由于本文沒有理論預設,并不清楚人口在這個高維空間中是如何分布的,因此并不知道社會可以劃分為多少個階層以及每個階層擁有什么樣的特征。為此,本文采用數據驅動的方式,使用無監督(unsupervised)的機器學習聚類(clustering)算法來幫助識別人口在這個空間中的分布狀況,尋找高維空間中聚集在一起的一個個“團體”來進行階層劃分。

  聚類算法的目標是將樣本劃分為若干個不相交的子集,每個子集叫做一個“簇”(cluster),每個簇對應這個子集一些潛在的特質,如高教育程度、高收入等;聚類算法事先并不清楚這些特質的存在,而是通過學習數據的分布結構找到內在性質和規律而自動形成的簇。聚類算法的聚類邏輯是“物以類聚”,即將擁有相似特征的樣本劃分到同一個簇,而不同簇的樣本之間盡可能不同,即簇內相似度(intraclustersimilarity)高而簇間相似度(interclustersimilarity)低。因而,“相似度”或稱“距離”是聚類算法簇劃分的重要依據。

  常見的相似度或距離測量方式有歐式距離(Euclideandistance)、曼哈頓距離(Manhattandistance)、osine相似性、圖中連邊概率等。不同的聚類算法采取不同的相似度或距離計算方式,當前常見的聚類算法可以分為五類:劃分式的聚類(如Means聚類算法及其變種)、層次聚類、基于密度的聚類、基于網格的聚類、基于圖的聚類(如譜聚類)和基于模型的聚類(如采用EM算法的高斯聚類)。

  在實際應用中,選擇哪種聚類算法取決于數據特征和算法的性能表現。而在運行完聚類算法對樣本進行簇劃分之后,還需要選取適當的性能度量指標對聚類的效果進行評估,以分析聚類算法是否實現了簇內相似度最高而簇間相似度最低的目標。值得一提的是,無監督的聚類算法需要研究者自己定義簇的個數,因此在實際研究中需要通過不斷調試模型參數來找到最佳的聚類簇數[37-38]。

  三、我國的社會分層——理論與數據雙驅動階層測量方法的應用

  2017年中國社會綜合調查(CGSS2017)共收集了12582個樣本,根據上述社會分層的七大要素,筆者在數據中選出相關變量對每個要素進行操作化,操作化過程見表。其中,CGSS2017的職業編碼采用ISCO08編碼,為獲得職業聲望和職業社會經濟地位,本文使用語言中的ISCO08ConveRsions程序來生成SIOPS08和ISEI08;社會資本的測量參考邊燕杰[39]測量城市居民社會資本的方法;網絡異質性的測量根據受訪者所認識的人中有幾個列出的職業類別:

  網頂為受訪者的社會網絡中的最高聲望,平均網絡質量為受訪者網絡中的平均聲望;閱讀習慣包括月均讀書本數、電子書本數,日均看報紙/雜志數量以及日均手機閱讀新聞咨詢小時數;生活方式來源于問卷A部分生活方式模塊中對媒體的使用情況、閑暇時間的活動、在空閑時間做什么事情三個量表,本文將量表進行重新編碼,轉換成虛擬變量②。

  因聚類模型不允許數據存在缺失值,但有些樣本在職業類型等關鍵變量上的答案缺失且無法填補,因此本文刪除了關鍵變量缺失的樣本,最后得到9726個樣本。為檢驗清理后樣本是否會導致關鍵變量與原樣本在分布上的差異,選取收入、受教育程度兩個常用于測量社會階層的重要指標進行檢驗。

  從分布形態上看,清理后樣本的收入、教育年限③和原樣本分布形態較為一致。同時對原樣本和清理后樣本進行了獨立樣本T檢驗,結果顯示二者在收入和教育程度的分布沒有顯著差異④。綜上,可以認為刪除職業等關鍵信息缺失的樣本并不會導致清理后樣本重要指標分布與原樣本的之間的偏差,本文對樣本的清理沒有損害原樣本的代表性。

  在使用簡潔模型驗證了理論與數據雙驅動模型的分層效力之后,筆者根據分層理論所涵蓋的七大要素將樣本映射到高維空間進行階層劃分。由于CGSS問卷的B、C、D部分是隨機抽樣填答,位于C部分的社會資本和位于D部分的消費結構相關問題并非所有受訪者都進行了回答,因此,本文構建了三個數據集分別進行分析。

  (1)全樣本數據:包含所有個案但不使用社會資本和消費結構變量的數據集,有9726個樣本和除社會資本外六大分層要素共52個變量。

  (2)社會資本數據集:包含除消費結構變量外所有變量的數據集,樣本量為3430,變量數為55。

  (3)消費結構數據集:包含除社會資本變量外所有變量的數據集,樣本量為2897,變量數為64。首先使用全樣本數據集建構社會階層空間來進行階層劃分。為避免各變量的量綱不同對計算聚類所造成的偏差,在對數據進行零均值標準化(score)①后,使用與簡潔模型相同的算法和參數設置對七大分層要素所構成的52維空間中的樣本進行聚類。結果顯示,在這一空間中,使用均值聚類算法將樣本聚集成3個子群體的CH得分最高,聚類效果最好。

  因此,本文采納最佳模型的結果將群體劃分為三個階層,并按照三個子群體的平均社會經濟地位得分高低進行排序,以此順序將其定義為低、中、高三個階層。為三個階層的人數分布情況,其中,中等階層規模最大,占總人口的42.22%;高階層的規模相對較小,占總人口的24.86%。

  由此可見,模型所劃分的三個階層既在等級參數分布上存在著低、中、高的差異,且在8個維度上的等級次序完全一致,同時在類別參數的分布上存在明顯差別,因此可以認為這三個群體的階層地位一致性程度較高,形成了邊界清晰的階層。為評估社會資本和消費結構對階層測量的影響,本文繼續加入社會資本特征和消費結構特征進行階層劃分,并用“類別不一致率”作為測量社會資本特征與消費結構對階層劃分的指標。

  類別不一致率的計算方式是:以上述全樣本數據的階層劃分結果為基準階層類別C,類別不一致率即為使用其他特征(數據集)進行階層劃分之后的類別Ci與基準類別C不一致成員的比例①。分別使用社會資本數據集和消費結構數據集來建構階層社會空間,為與基準類別進行對比,同樣使用簇數為3的Means聚類模型進行階層劃分,且按照isei對模型所得出的簇標簽進行排序,得到低、中、高三個階層。

  總體而言,兩個模型的分類不一致率較低,對樣本的階層劃分均與全樣本模型的階層劃分相差不大,加入社會資本和消費結構特征后,分別僅有5.9%和7.5%的成員階層類別發生了變化。從模型的表現上來看,加入社會資本和消費結構變量后,模型的CH得分相較于全樣本模型(CH得分為2098.67)大幅降低,模型聚類效果變差①。因此可以認為,對于CGSS2017所調查的這一部分人而言,社會資本和消費結構對于階層測量和階層劃分而言作用不大②。

  四、結論與討論

  如何測量和劃分社會階層是社會分層研究者長期爭論的焦點。我國社會學研究者對如何分層作出了許多嘗試,提出了豐富的階層測量方法和分層體系,得出了對我國的社會階層結構的不同看法,但這些研究都面臨一個問題——階層測量和階層劃分的真實性和有效性難以在現實中得到驗證。

  在大數據時代,盡管一些研究者做出了基于社會現實(大量的、真實的數據)測量階層的嘗試,但由于其數據的限制導致其測量指標可能并不是區分階層的關鍵。本文在回顧社會分層理論和研究中的經典分層理論、方法模型和具有代表性的分層研究后,將當前的社會分層方法歸納為理論和數據驅動的兩種階層測量范式,通過對比兩種范式下的分層方法,發現二者各自存在弊端。為此,嘗試提出將二者結合起來的理論與數據雙驅動的階層測量框架:

  理論驅動在于根據過往分層理論中提出的對階層劃分有意義的資源(要素)整合了七種分層要素及其操作化方法,基于布勞的宏觀社會結構理論來構建分層的社會階層空間;數據驅動在于使用無監督聚類方法,完全由“機器”決定社會應該分為幾個階層,以及每個階層包含那些人。在數據與理論雙驅動的階層測量框架下,本文使用CGSS2017數據對中國的社會階層進行劃分。首先使用簡潔模型來驗證所提出的分層框架和方法的有效性,發現使用無監督聚類模型可以有效識別出社會空間中的不同階層,并且發現了現實中存在階層地位不一致現象。即構建的模型既可以識別出已經形成階層邊界的高地位一致性的階層,也可以識別出階層邊界尚不清晰的低地位一致性的“利益群體”。

  之后建構了包含經濟資源、職業資源、人力資本、文化資源、單位地位和制度分割、民權資源六大分層要素共52個維度的高維社會階層空間,并使用聚類模型進行階層劃分,結果顯示,高維空間中的人口可被劃分為三個子群體,通過比較三個子群體在收入、聲望、職業社會經濟地位、人力資本和文化資本上的差異,發現這三個邊界清晰的群體代表著我國社會低、中、高三個階層,且這三個階層具有高地位一致性。接著使用社會資本模型和消費結構模型對人口進行分層,通過對比這兩個模型與全樣本模型的分類一致性,發現加入社會資本和消費結構的相關變量并不會引起分層結果的改變,并且在考慮更多特征后,模型的性能反而下降。

  也就是說,社會資本和消費結構特征對社會分層的作用不大。那么社會分層最重要的指標究竟為何呢?本文進一步使用機器學習的決策樹模型分析了每個指標(特征)對于測量(預測)個體階層等級的重要性。結果發現,在我國,單位類型是社會分層最重要的指標,職業社會經濟地位得分次之,而其他特征對估計個體社會階層的重要性微乎其微。

  進一步使用僅含有單位類型和社會經濟地位得分的模型進行階層劃分,結果鞏固了這一結論:在僅考慮單位類型和職業社會經濟地位水平時,模型對70%的人口的階層劃分與考慮52個指標時并無差異。本研究還存在一些需要改進之處:首先,在分層指標的操作化上,由于數據的局限性,對社會資本的測量較為簡單,只考慮了個體的網絡規模和網絡所蘊含資源的最高可達性和異質性,還需要收集更多社會網絡結構和整體網的數據,將個體網絡結構和個體在整體網絡結構中所處的位置納入社會資本的測量中。

  其次,本文所得出的“社會資本和消費結構特征對于階層劃分意義不大”的結論是基于CGSS2017的數據得出的結果,但由于CGSS2017在詢問社會網絡相關議題時,只是隨機選擇了1/3的受訪者進行填答,因此樣本量較全樣本而言有較大損失,雖然進行了多種驗證發現這一結論具有穩健性,但若條件允許,在同一個樣本上進行比較更為嚴謹;最后,本研究只是基于CGSS2017數據,得出結論的穩健性還需要進一步使用其他數據進行驗證。

  此外,本研究僅僅是對社會分層的方法上的探索,并基于這一方法對我國的社會階層劃分作出嘗試,今后可以努力的方向還有很多,例如使用GSS其他國家的數據,使用這一方法進行國際社會分層的比較等等。同時,階層是一種社會結構的維度,當前對社會階層的劃分主要采取的是“地位結構觀”這一理論視角,即把階層視為屬性和等級不同的群體,但社會結構還有另外一種理論視角——“網絡結構觀”。

  在這一視角下,對群體的劃分一般采用社團分割的辦法——基于人與人之間實際存在的交往關系所形成的群體分化來進行階層劃分,這種方法仍然值得探索。最后,社會分層包含兩個層面,一是如何測量和劃分階層,本文已經實現了這一目標;二是理解階層結構是如何形成以及如何隨著社會的發展而產生變化的,這也是筆者下一步努力的方向。

  參考文獻

  [1]李強.社會分層十講:第2版[M].北京:社會科學文獻出版社,2011.

  [2]戴維·格倫斯基.社會分層:第2版[M].王俊,譯.北京:華夏出版社,2005.

  [3]埃里克·歐林·賴特.階級[M].劉磊,呂梁山,譯.北京:高等教育出版社,2006.

  [4]GOLDTHORPEJH,HOPEK.Thesocialgradingofoccupations:anewapproachandscale[M].Oxford:ClarendonPress,1974.

  [5]GOLDTHORPEJH,LLEWELLYNC.ClassmobilityinmodernBritain:threethesesexamined[J].Sociology,1977,11(2),257-287.

  [6]GOLDTHORPEJH,PAYNEC.Ontheclassmobilityofwomen:resultsfromdifferentapproachestotheanalysisofrecentBritishdata[J].Sociology.1986.20(4),531-555.

  [7]侯利明,秦廣強.中國EGP階層分類的操作化過程:以中國綜合社會調查(CGSS)數據為例[J].社會學評論,2019(2):16-26.

  作者:梁玉成,賈小雙

主站蜘蛛池模板: 日韩黄色一级毛片 | 一级毛片完整免费版 | 亚洲欧美在线免费 | 日韩在线一区二区三区免费视频 | 国产精品yjizz视频网一二区 | 91成人影院未满十八勿入 | v视界成人影院在线视频 | 亚洲日本高清成人aⅴ片 | 国产午夜三级 | 麻豆影业| 成人国产精品一级毛片了 | 国产酒店视频 | 韩国一级特黄毛片大 | 久操视频免费观看 | 国产精品公开免费视频 | 91一区二区在线观看精品 | 国产欧美日韩另类一区乌克兰 | 成人区精品一区二区不卡亚洲 | 国产精品区网红主播在线观看 | 2021久久精品国产99国产 | 国产精品成人扳一级aa毛片 | 偷拍久久网 | 国产精品一二三 | 国产三级在线免费观看 | 久久国产乱子免费精品 | 在线一区视频 | 国产成人综合亚洲欧美在 | 鲁丝一区二区三区不属 | 精品一区二区三区在线成人 | 激情区| 一级欧美一级日韩 | 亚洲综合图片区 | a毛片免费看| 国产免费高清福利拍拍拍 | 亚洲国产精品一区二区第一页 | 日本三级成人中文字幕乱码 | 精品精品国产高清a毛片 | 久久久99精品免费观看精品 | 香港a毛片 | 国产免费一区2区3区4区 | 成人国内精品久久久久影 |