가짜 뉴스 탐지.

가짜 뉴스 탐지
가짜 뉴스는 많은 잘못된 정보로 이어지기 때문에 세계에서 가장 큰 문제 중 하나입니다. 이러한 거짓 뉴스의 대부분은 지역 사회의 정치적, 종교적 신념에 관한 것일 수 있으며 귀하가 거주하는 국가에서 분명히 보았을 것처럼 폭동과 폭력으로 이어질 수 있습니다. 따라서 가짜 뉴스를 탐지하기 위해 우리는 가짜 뉴스 헤드라인 간의 관계를 찾을 수 있으므로 단순히 헤드라인을 관찰하여 특정 정보가 가짜인지 진짜인지 알려주는 기계 학습 모델을 훈련할 수 있습니다.

Python을 사용한 가짜 뉴스 탐지
가짜 뉴스 감지 작업을 위한 내 데이터 세트에는 뉴스 제목, 뉴스 콘텐츠 및 뉴스가 가짜인지 진짜인지를 표시하는 레이블로 알려진 열에 대한 데이터가 있습니다. 따라서 이 데이터 세트를 사용하여 가짜 뉴스 헤드라인과 실제 뉴스 헤드라인 간의 관계를 찾고 대부분의 가짜 뉴스에 어떤 유형의 헤드라인이 있는지 이해할 수 있습니다. 아래는 내 데이터 세트입니다.

데이터 세트

> #we're loading data into our notebook
> import numpy as np
> import pandas as pd
> import matplotlib.pyplot as plt
> import warnings

#importing our data through pandas
#importing our data through pandas
data=pd.read_csv('/content/drive/MyDrive/news.csv')

#we check how our data looks like
data

#we do data analysis and preprocessing
data.describe()


#To check the total number of rows in our data
data.count()

#To check whether our data have missing values
data.isnull().sum()

#we convert label into 1 and 0
data['label'] = data['label'].apply(lambda x: 1 if x == 'REAL' else 0)

#we convert our data from categorigal to numerical
dummies=pd.get_dummies(data[['title','text']])

#we split our data into x and y
x=data.drop('label',axis=1)
y=data['label']

#lets import the model
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import train_test_split

np.random.seed(42)
model=RandomForestClassifier()
x_train,x_test,y_train,y_test=train_test_split(dummies,
                                              y,
                                              test_size=0.2)
model.fit(x_train,y_train)

model.score(x_test,y_test).

Reference

이 문제에 관하여(가짜 뉴스 탐지.), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/kamauruth/fake-news-detection-48k2

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다