가짜 뉴스 탐지.

가짜 뉴스 탐지
가짜 뉴스는 많은 잘못된 정보로 이어지기 때문에 세계에서 가장 큰 문제 중 하나입니다. 이러한 거짓 뉴스의 대부분은 지역 사회의 정치적, 종교적 신념에 관한 것일 수 있으며 귀하가 거주하는 국가에서 분명히 보았을 것처럼 폭동과 폭력으로 이어질 수 있습니다. 따라서 가짜 뉴스를 탐지하기 위해 우리는 가짜 뉴스 헤드라인 간의 관계를 찾을 수 있으므로 단순히 헤드라인을 관찰하여 특정 정보가 가짜인지 진짜인지 알려주는 기계 학습 모델을 훈련할 수 있습니다.

Python을 사용한 가짜 뉴스 탐지
가짜 뉴스 감지 작업을 위한 내 데이터 세트에는 뉴스 제목, 뉴스 콘텐츠 및 뉴스가 가짜인지 진짜인지를 표시하는 레이블로 알려진 열에 대한 데이터가 있습니다. 따라서 이 데이터 세트를 사용하여 가짜 뉴스 헤드라인과 실제 뉴스 헤드라인 간의 관계를 찾고 대부분의 가짜 뉴스에 어떤 유형의 헤드라인이 있는지 이해할 수 있습니다. 아래는 내 데이터 세트입니다.

데이터 세트

> #we're loading data into our notebook
> import numpy as np
> import pandas as pd
> import matplotlib.pyplot as plt
> import warnings



#importing our data through pandas
#importing our data through pandas
data=pd.read_csv('/content/drive/MyDrive/news.csv')



#we check how our data looks like
data



#we do data analysis and preprocessing
data.describe()





#To check the total number of rows in our data
data.count()



#To check whether our data have missing values
data.isnull().sum()



#we convert label into 1 and 0
data['label'] = data['label'].apply(lambda x: 1 if x == 'REAL' else 0)



#we convert our data from categorigal to numerical
dummies=pd.get_dummies(data[['title','text']])



#we split our data into x and y
x=data.drop('label',axis=1)
y=data['label']



#lets import the model
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split



np.random.seed(42)
model=RandomForestClassifier()
x_train,x_test,y_train,y_test=train_test_split(dummies,
                                              y,
                                              test_size=0.2)
model.fit(x_train,y_train)



model.score(x_test,y_test).

좋은 웹페이지 즐겨찾기