고급 검색 및 쿼리 언어. 검색 엔진 언어
쿼리 언어는 데이터베이스 및 정보 시스템에서 쿼리를 만드는 데 사용되는 인위적으로 작성된 프로그래밍 언어입니다.
일반적으로 이러한 쿼리 메서드는그것들이 데이터베이스 용으로 사용되는지 정보 검색 용으로 사용되는지에 따라 분류합니다. 차이점은 해당 서비스에 대한 요청이 제기 된 질문에 대한 실제 답변을 얻는 반면 검색 엔진은 관심있는 영역과 관련된 정보가 포함 된 문서를 찾으려고한다는 것입니다.
데이터베이스
데이터베이스 쿼리 언어에는 다음 예제가 포함됩니다.
- QL - 객체 지향, 관계형 데이터베이스를 가리 킵니다. 데이터 로그의 후계자.
- 문맥 (CQL)은 정보 검색 시스템 (예 : 웹 색인 또는 서지 목록)을위한 공식적인 쿼리 언어입니다.
- CQLF (CODYASYL) - CODASYL-TYPE 데이터베이스 용.
- 개념 지향 쿼리 언어 (COQL) -각 모델 (com)에서 사용됩니다. 이것은 데이터 모델링의 원리에 기반을두고 다차원 분석, 분석 작업 및 결론의 투사 및 비영리와 같은 작업을 사용합니다.
- DMX - 광산 모델에 사용됩니다.
- Datalog는 연역적 데이터베이스를위한 쿼리 언어입니다.
- 겔리 쉬 영어는Gellish English 데이터베이스의 쿼리에 사용되며 대화 (요청 및 응답)가 가능하며 지식 지식의 정보 모델링에도 사용됩니다.
- HTSQL - HTTP 요청을 SQL로 변환합니다.
- ISBL - PRTV (첫 번째 관계형 데이터베이스 관리 시스템 중 하나)에 사용됩니다.
- LDAP는 TCP / IP를 통해 실행되는 쿼리 및 디렉터리 서비스를위한 프로토콜입니다.
- MDX - OLAP 데이터베이스에 필요합니다.
검색 엔진
검색 질의 언어는 차례로,검색 엔진에서 데이터를 찾는 것을 목표로합니다. 쿼리가 일반 텍스트 나 하이퍼 텍스트에 추가 구문 (예 : "and"/ "or")을 포함하는 경우가 다릅니다. 이것은 엄격한 명령 구문에 의해 관리되거나 위치 매개 변수를 포함하는 표준 유사 언어와 상당히 다릅니다.
검색 쿼리는 어떻게 분류됩니까?
다음 세 가지 범주가 있습니다.정보 검색, 탐색 및 트랜잭션과 같은 대부분의 검색 쿼리를 포괄합니다. 이 분류가 이론적으로는 고정되어 있지는 않지만, 경험적으로 검색 엔진에서의 실제 쿼리의 존재로 확인되었습니다.
정보 요청은수천 가지 관련 결과를 얻을 수있는 폭 넓은 주제 (예 : 특정 도시 또는 트럭 모델)를 다룹니다.
탐색은 특정 주제 (예 : YouTube)에서 단일 웹 사이트 또는 웹 페이지를 검색하는 검색입니다.
거래 - 자동차 구매 또는 항공권 예약과 같은 특정 작업을 수행하려는 사용자의 의도를 반영합니다.
검색 엔진은 종종 네 번째 항목을 지원합니다.요청 빈도가 훨씬 적게 사용됩니다. 이는 색인 된 웹 그래픽 (특정 URL에 대한 링크 수 또는 특정 도메인에서 색인화 된 페이지 수)에 대한 연결 보고서를 포함하는 소위 연결 요청입니다.
정보 검색은 어떻게됩니까?
대부분의 검색 엔진은검색 로그이므로 사용자가 웹에서 찾고있는 정보를 찾기가 매우 어렵습니다. 그럼에도 불구하고 최초의 과학 연구는 1998 년에 나타났습니다. 나중에, 관련성이 높은 것으로 표시된 쿼리를 분석 한 두 번째 연구가 2001 년에 수행되었습니다. 또한 쿼리 언어가 검색 엔진에서 어떻게 사용되는지도 명확 해졌습니다.
웹 검색과 관련된 흥미로운 기능이 알려졌습니다.
평균 검색어 길이는 2.4 단어입니다.
- 약 절반의 사용자가 하나의 요청을 보냈고 사용자 중 3 분의 1보다 적은 수가 3 개 이상의 고유 요청을 하나씩 만들었습니다.
- 거의 절반의 사용자가 첫 번째 또는 두 페이지의 결과 만 보았습니다.
- 사용자 중 5 % 미만 만 고급 검색 기능을 사용합니다 (예 : 특정 범주 선택 또는 검색에서 검색).
사용자 지정 작업 기능
이 연구는 또한 요청의 19 %지리적 용어 (예 : 이름, 우편 번호, 지형지 물 등)가 포함되어 있습니다. 또한 짧은 쿼리 (즉, 여러 조건이 있음) 외에도 사용자가 검색 문구를 변경 한 예측 가능한 패턴이 종종 있음을 알 수 있습니다.
또한 33 %의 요청이한 사용자가 반복되며, 87 %의 경우에 사용자는 동일한 결과를 클릭합니다. 이는 많은 사용자가 정보를 검토하거나 다시 찾기 위해 반복적 인 요청을 사용함을 의미합니다.
쿼리 빈도 분포
또한 전문가들은요청의 빈도 분포는 멱 법칙에 해당합니다. 즉, 키워드의 작은 부분이 가장 큰 요청 목록 (예 : 1 억 개 이상)에서 관찰되며 가장 자주 사용됩니다. 같은 주제의 프레임 워크에있는 나머지 문구는 덜 자주 사용됩니다. 이 현상을 파레토 (Pareto) 원칙 (또는 "rule 80-20")이라고하며, 검색 엔진이 데이터베이스 인덱싱 또는 분할, 캐싱 및 프리 페치와 같은 최적화 기술을 사용할 수있게하고 검색 쿼리 언어를 향상시킬 수있게했습니다.
최근 몇 년 동안, 평균 길이검색어는 꾸준히 증가하고 있습니다. 따라서 영어로 된 평균 질의는 더 길어졌습니다. 이와 관련하여 Google은 "Hummingbird"(2013 년 8 월)라는 업데이트를 도입했으며 프로토콜이 아닌 "음성"쿼리 언어 (예 : "가장 가까운 커피 숍은 어디 있습니까?")로 긴 검색 문구를 처리 할 수 있습니다.
더 긴 요청의 경우 처리가 사용됩니다. 표준 언어로 작성된 구로 나뉘며 다른 부분에 대한 답변은 별도로 표시됩니다.
구조화 된 쿼리
논리를 지원하는 검색 엔진연산 및 구문은 고급 쿼리 언어를 사용합니다. 여러 주제 또는 얼굴을 포함하는 문서를 검색하는 사용자는 단어의 논리적 특징에 따라 각각을 기술 할 수 있습니다. 논리 핵심어는 특정 구문과 구두점 모음입니다.
고급 검색이란 무엇입니까?
검색어 "Yandex"와 "Google"이 가능합니다.특정 조건에서보다 집중된 검색을 수행합니다. 고급 검색은 특정 카테고리 및 이름 목록뿐만 아니라 페이지 이름의 일부 또는 제목의 접두어로 검색 할 수 있습니다. 제목이나 특정 주제 그룹에있는 특정 단어가 포함 된 페이지 검색을 제한 할 수도 있습니다. 쿼리 언어를 올바르게 사용하면 다양한 종결 문자 및 유사한 맞춤법이있는 사용자 정의 단어 사용을 포함하여 대부분의 검색 엔진을 발행 한 결과보다 더 복잡한 매개 변수를 처리 할 수 있습니다. 고급 검색 결과를 표시 할 때 페이지의 관련 섹션에 대한 링크가 표시됩니다.
이것은 또한 모든 페이지를 검색 할 수있는 기능입니다.특정 문구를 포함하는 반면, 표준 쿼리를 사용하면 검색 엔진은 어떤 토론 페이지에서도 멈출 수 없습니다. 대부분의 경우 쿼리 언어는 noindex 태그에있는 페이지로 이어질 수 있습니다.
경우에 따라 올바른 형식의 쿼리를 사용하면 여러 특수 문자와 다른 영문자 (예 : 중국어 문자)가 포함 된 정보를 찾을 수 있습니다.
쿼리 언어의 문자는 무엇입니까?
대문자와 소문자 및 일부분음 기호 (움라우트 및 악센트)는 검색에서 계산되지 않습니다. 예를 들어 키워드 Citroen을 사용한 검색은 Citroen이라는 단어가 포함 된 페이지를 찾지 않습니다. 그러나 일부 합자는 개별 문자에 해당합니다. 예를 들어, "aeroscobing"이라는 단어를 검색하면 "Ereskebing"(AE = Æ)이 포함 된 페이지를 쉽게 찾을 수 있습니다.
많은 영숫자가 아닌 문자가 끊임없이 사용됩니다.무시. 예를 들어, 문자열 | L |을 포함하는 쿼리에 대한 정보를 찾는 것은 불가능합니다. (두 개의 수직 막대 사이에있는 글자).이 기호는 일부 변환 템플릿에서 사용됩니다. 결과에는 "LT"의 데이터 만 있습니다. 일부 문자 및 구문은 다르게 처리됩니다. 정확한 이름이 "credit (Finance)"인 기사가 있더라도 "credit (Finance)"요청은 "credit"및 "finance"라는 단어가있는 기사를 표시하며 대괄호는 무시합니다.
쿼리 언어와 함께 사용할 수있는 많은 함수가 있습니다.
구문
검색어 "Yandex"와 "Google"은구두점을 사용하여 검색 범위를 좁히십시오. 예를 들어 중괄호 - {{search}}입니다. 그 안에 들어있는 문구는 변경되지 않은 채 전적으로 검색됩니다.
큰 따옴표로 묶은 구는검색 개체. 예를 들어, 인용 부호로 된 단어는 비 유적 표현이나 가상의 문자로 인용 부호없이 사용되는 것으로 인식됩니다.
또한 모든 주요 검색 엔진은 논리적 "not", "and"및 "or"에 대한 "-"기호를 지원합니다. 예외는 하이픈 또는 대시로 구분할 수없는 용어입니다.
검색 구문의 부정확 한 일치가 표시됩니다.기호 ~. 예를 들어 용어 나 이름의 정확한 단어를 기억하지 못하는 경우 검색 막대에서 지정된 기호로 지정할 수 있으며 유사도가 가장 높은 결과를 얻을 수 있습니다.
맞춤 검색 옵션
또한 검색 옵션 (예 : intitle,및 인센티브. 콜론으로 구분 된 필터는 "filter : query string"형식입니다. 쿼리 문자열은 검색 용어 나 구 또는 페이지의 전체 이름을 포함 할 수 있습니다.
기능 "intitle : 검색어 "는 이름별로 검색 결과에 우선 순위를 부여하지만 제목 내용에 대한 일반적인 결과도 표시합니다. 이 필터 중 여러 개를 동시에 사용할 수 있습니다. 이 기회를 이용하는 방법?
양식의 요청 "intitle : 공항 이름 "은 제목에 공항 이름이있는 모든 기사를 표시합니다. "공항 이름 : 주차장 이름"으로 공식화하면 제목에 공항 이름이 적혀 있고 텍스트에 주차 언급이 포함 된 기사를 받게됩니다.
필터로 검색 "범주 : 카테고리 "는 특정 그룹 또는 페이지 목록에 속한 기사의 초기 발행 원칙에 따라 작동합니다. 예를 들어, "Temples incategory : History"와 같은 검색어는 사원 역사의 주제에 대한 결과를 생성합니다. 이 기능은 다양한 매개 변수를 설정하여 확장 된 기능으로도 사용할 수 있습니다.